メディア蚘事

海倖の技術者が日本語の「文字化け」を本気で解説、日本人顔負けの日本通っぷりが披露される

バズる指数ピヌク 233

 twitterコメント 86件䞭 186件
『Mojibake文字化け』っお倖囜でも通じる蚀葉だったんですね🀯
➡➡➡

--
▶ブログ【IFTTTの先ぞ】
文字化けずいう日本語に぀きたずう盲腞炎のような事象メモ。
Unicodeが普及しお以降、ほが芋る事も無くなっおきたしたが、今でも半角カタカナを芋るず殺意が笑
mojibakeっおいうのか
[tech][nlp] MOJIBAKE
「文字化け」は、海倖の技術者の間でも「Mojibake」で通甚する
文字化けは、日本固有の事象っおこず
デむリヌポヌタルZが登堎しおるやん
戻り倀にこれ芋よがしにu付けおくるのに、u぀けお枡すず察応出来ないmaya2019さん可愛い🥰
これは面癜い
真面目に解説しおる。おもろいなぁ。
>特に目立぀のは『高』の異䜓字の『髙』で、線が぀ながっおいるこずから『はしごだか』ず呌ばれ
ナルホド。🐈
日本人も知らないような平安時代通の倖囜人ずか
倖囜人杜氏ずか
ず同じ匂いがするw
囜内の技術者じゃん倧笑い
「東京で自然蚀語凊理(NLP)の開発をしおいるポヌル・オリヌリ・マッキャン氏が解説」
譁?怜喧瞺代▲瞺讌瞺励繧医?çž²
瞺繧薙°遏繧峚瞺代←螂瞺阪↑繧薙瞺瞲
「慣れるず䜿われおいる文字コヌドの皮類を掚枬するこずができるそう」

足利矩満が座っおいる畳の瞁ww
ほヌヌヌ。
文字化けの蚘事
テックネタかず思ったら(いやそうなんだけど)、文字化けから足利矩満に飛ぶずは意衚w
UNIX/Win/Web/汎甚機ず混圚し、IT珟堎では日垞的に発生する文字化け。EBCDICに蚀及は無いが良く知っおるな倖人。
繧繝なんお䜿ったこずも曞いたこずもないぞ
凄いな〜
本圓に䜕気なく文字化けしおいるんだ皋床にしか考えたこずなかったな
䌚瀟のPCの゚クセルのバヌゞョンが未だにShift-JIS暙準でCSV開こうずする。これがただShift-JISのシステムが残る背景になりグロヌバルず連携した時文字化けしお䞀時的察策で囜内ナヌザにUTF-8察応゚ディタ䜿えずはいうのも優しくないし悩み䞭。
い぀も雰囲気でデコヌドしおる
なるほどわからんしおきた
ナニコヌドが普及しお文字化けは少なくなったよね。
ちゃんずmojibakeずいう単語で理解されおるのか。
PerlのスクリプトっおEUC-JPが倚かったっけ。でもサむトはShift_JISだったりしおいろいろ面倒だった。今は昔  »
文字化けから足利矩満が出おくるずは 
はえヌ
おもろいやん
>
ぞヌ
凄そうです。
おもしろ
文字化けは奥が深い
足利矩満の畳の瞁が「繧繝瞁」からのアニメ「裏䞖界ピクニック」の看板ずは振れ幅がスゎすぎる
「文字が適切に衚瀺されずに読めなくなっおしたう『文字化け』は、海倖の技術者の間でも『Mojibake』で通甚する」
“マッキャン氏は、この知識を生かしお2021幎に攟送されたアニメ「裏䞖界ピクニック」に登堎した文字化けした看板が、UTF-8をシフトJISで衚瀺したものだずいうこずを芋抜きたした。”
蚘事の内容はおもしろいけど、EUC-JPに぀いおの説明がものっっすごい雑だなヌ
(ω)
髙やが化けるのは「厳密にはSJISに含たれないのにUTF-8に倉換するずき、SJIS→UFT8ず指定しお文字コヌド倉換した時」だず思うので、なんか違和感がある蚘茉だな。 CP932等指定する必芁がある / “海倖の技術者が日本語の「文字化け」を本気で解説 ”
海倖ニキが「はしごだか」ず「た぀さき」を理解しおるのすごい。
私は文字化けに悩たされたし文字コヌドの本も読んだけど結局よく分らんたた今に至っおいる。

GIGAZINE「
慣れるず重力語も読めるようになりたす 。
こういうの死ぬほどすき
文字化けがワヌドパズルみたいに遊ばれおる日本人には出来ない発想だなヌ圓たり前
Oh! Japanese Mojibake!
MojibakeずかTofuずか、日本人の苊劎は䞖界に知られおいるっぜいよ(苊笑。
文字化けマむスタヌがおるw
この文字コヌドの違いのせいで䜕癟䜕千ずいう人の血が流れた事か あず倖字 😭
UTF-8頑匵っお
—
文字化けは海倖の技術者の間でも「Mojibake」で通じるそう。文字化けは䜜成した時ず異なる文字コヌドで開くこずで発生するが、慣れるず䜿われおる文字コヌドが分かるずのこず。
䞊手くたずたっおお现切れの知識が脳内で統合された。
個人的に超良蚘事。
文字化けっお海倖でも"Mojibake"で通じるのか...
文字化けは日本文化だった
なかなか滅びんよね
文字化けっお英語でも「mojibake」なのか  
  から文化を語る人が珟れたした、當方も知らない挢字の知識が出お驚きですね文字化けずいう蚀葉が英語のたた䜿えるのは知りたせんでした
今曎感もあるけど、すごいな
日本語っお他の蚀語より文字化けの問題が倧きそうだし、 Mojibake ず蚀われおも仕方ないのかもしれない。
分かりやす
なかなか興味深い
普段文字コヌドを扱っおるので、個人的にツボった。
EUC-JPは今でも现々ず䜿われおいるのだよな。そしおEBCDIKも生き残っおいる。Shift_JISも厳密には拡匵挢字による違いがあるし。
「EUC-JPをシフトJISで開いた文字化けで興味深いのは、半角カタカナがよく出おくる点です。これは、シフトJISが半角カタカナを1バむトで衚しおいるからです」
繧繝繧
文字コヌドずかいうムカ぀くものがあるからな。
面癜いね、技術の進歩や違いで互換性がなくなったがゆえにこういうこずが起きるんやなっお
文字化けにも違いがあるんですっお奥様
面癜すぎるな、この蚘事
海倖でも「Mojibake」なのね。
»
文字化けっお、解説されるず面癜い‌
文字コヌドが異なるず文字化けするんだ😂
パタヌンがあるのは䜕ずなく知っおたけど、なんで起きるのかはよく分かっおなかった😱
勉匷させおもらいたした‌
ありがずうございたした‌
byこす
たるで、デむリヌポヌタルZがお圹立ちサむトみたいに出おきお笑う。
[あずで読む]
文字コヌド絡みは仕事でよく出くわすが、これはホントにマニアの仕事。
ガチ勢でワロタ
こちずらこの問題を珟圹でやっおきたりェブプログラマヌおじさんやぞどいたどいた
shift-jis -> utf-8
をしたいずきは
cp932 -> utf-8
ずするず幞せになれる
たさかの裏䞖界ピクニック関連案件だった
> 神経蚀語プログラミング(NLP)
蚘事䞭『「文字化け」は、海倖の技術者の間でも「Mojibake」で通甚するずのこず』
こんな日本語も囜際的になっおるのか
NLPっおNatural Language Processingの方じゃないかな。
7bit文字化けもやっお
20䞖玀末みたいな昔の文字化けも同じ理由なのかしら
これ面癜い
→
📍
📝
【出所 / 厳遞】
盎接関係はないんだけど、シフトJIS関連で、2バむト目の5Cチェックでよく䜿われたのが、゜連構造改革だったかな
Pocket New item archived:
文字化け、海倖でもMOJIBAKEで通じるんだ。それに驚きだわ
【ゆかりさんニュヌス】
タむトルずURLをコピヌしたした