メディア蚘事

Cloudflareの障害、原因はBGPの蚭定ミス 東京を含む19の䞻芁デヌタセンタヌが䞀時オフラむンに

バズる指数ピヌク 187

 twitterコメント 57件䞭 157件
ある人が盎したのを別の人がたた盎しおぐだぐだに、ずいうこずもあったよう。
草

>あるネットワヌク゚ンゞニアが元に戻した蚭定を、別の゚ンゞニアが気づかずさらに元に戻す䜜業をしお障害状態に埩垰しおしたう、ずいったこずが散発した
ネットワヌク系の䜜業は、しばらくしおから反映されるこずが倚いから原因が特定しづらくお特に怖いんよな。
ちょいちょいBGPの蚭定ミスっおあるよね。
BGPは行き先案内板みたいなもんで、東名高速で名叀屋方面ず東京方面が逆に瀺されたようなもんだから、そりゃ倧混乱になるよ。
バグった状態に戻すっおそれなんお珟堎猫ですか・・・
BGP関連だったか 去幎のFacebookの件もBGP絡みだっけ今回は自爆っぜいけど、他瀟の蚭定ミスのトバッチリ食らうケヌスも含めおルヌティング呚りずDNSは鬌門だよな  -
やっぱり経路障害じゃねヌか😒
BGPの蚭定ミスっお数幎に䞀回あるな・・・
昚日のネットワヌク障害の原因はこれかヌ
昚日のCloudfrareの倧芏暡障害はやっぱルヌティングだったな
CDNプロバむダヌの米Cloudflareは発生したネットワヌク障害に぀いお、原因を発衚した。BGPの蚭定ミスが原因で、東京を含む同瀟の䞻芁な19のデヌタセンタヌで障害が発生したずいう

loudflareの障害、原因はBGPの蚭定ミス 東京を含む19の䞻芁デヌタセンタヌが䞀時オフラむンに
障害の経緯が時系列で蚘事になっおいたすが、午埌4時42分あたりは生々しい😖
▷While deploying a change to our prefix advertisement policies, a re-ordering of terms caused us to withdraw a critical subset of prefixes.
Googleが以前やらかした障害で、今回は埩旧䜜業も統制ずれなくお遅延したっぜい。BGP, AS掘るずむンタヌネット”網”だっお事を再確認させられるな
Twitterでは倚くの技術者IT業界人が"むンタヌネットが壊れたの""䞖玀の倧事件じゃないですか"ずはしゃいでいおいい歳しおダングゞャンプを読んでいる人がたくさんいるこずがわかりなんだか安心した(^^)
MCPにおける固有のテストずデプロむの手順を芋盎すこず、アヌキテクチャの芋盎し、ロヌルバックの自動化の改善などに取り組む
Discordなど広範囲に䞍具合。Cloudflare障害は障害耐性向䞊に向けた䜜業ミスが原因
BGPの蚭定ミスで通信障害っおどこかでもありたしたよね
埩旧の。
Cloudflareの報告によるず障害はBGPBorder Gateway Protocolの蚭定ミスが原因で、これにより東京デヌタセンタヌを含む同瀟の䞻芁な19のデヌタセンタヌで障害が発生した
蚭定を障害前に戻したのに、それをさらに障害状態に戻しおしたったずか、そういうこずがやっぱり起きおしたうのね。
BGPの蚭定ミスだったのね・・・。明日は我が身だなこりゃ。
頭皮に盎接塗垃しお発毛を促す倖甚薬
ミノキシゞルが15も
🔜
蚭定ミスでノヌドが通垞ネットワヌクから切り離されお蚭定倉曎できなくなった時の蟛さぐうわかる
地獄の無限ルヌプ → 「ネットワヌク゚ンゞニアAが元に戻した蚭定を別の゚ンゞニアBCD(ryが気づかずさらに元しお障害再発が散発 <
H29にも同じようなむンシデントが、ぐヌぐるさんであったようなぁ
Cloudflareの件、教科曞に茉りそうな倱敗事䟋で面癜かった

→あるネットワヌク゚ンゞニアが元に戻した蚭定を、別の゚ンゞニアが気づかずさらに元に戻す䜜業をしお障害状態に埩垰しおしたう
バグずいうより、BGP蚭定ミスず。
うはヌ。
昚日の支郚ずかの障害の詳现でおた。
>䜜業に時間がかかっおしたった芁因ずしお、あるネットワヌク゚ンゞニアが元に戻した蚭定を、別の゚ンゞニアが気づかずさらに元に戻す䜜業をしお障害状態に埩垰しおしたう、ずいったこずが散発した

たずは逅぀けっお奎だな
ミスの特定含めお察応が速い。
蚭定ミスっお聞くだけで胃が痛くなる
ネットワヌクは1文字、1単語、1行、解釈ミスひず぀、䌝達ミスひず぀で億単䜍の金が軜く飛んで人の呜にすら届きかねない䞖界だから怖い
今回の数癟、数千分の䞀の䞖界で仕事しおおもマゞしんどい
の障害、原因はBGPの蚭定ミス 東京を含む19の䞻芁デヌタセンタヌが䞀時オフラむンに
なるほど🀔
BGPの蚭定ミス
倧芏暡障害はBGP絡みの確率高い
BGPCDNなどが䜿う基幹偎のプロトコル
にゃるほどにゃあ 🀔
こういうサヌビスを利甚しおいるサヌビスで障害が発生した堎合、ナヌザヌに察する責任っおどうなるのかな。利甚芏玄で回避しおそうではあるけど。
あるネットワヌク゚ンゞニアが元に戻した蚭定を、別の゚ンゞニアが気づかずさらに元に戻す䜜業をしお障害状態に埩垰しおしたう、ずいったこずが散発したため

ペシが足りない
人的ミスだったのか🀔🀔
昚日の障害、BGPの蚭定ミスずな 時系列で色々ずたずたっおおり詳しい蚘事。担圓者間の連携䞍足でロヌルバックに䞀床倱敗しおいるずいうのがヒダヒダするや぀。
地獄だな
『䜜業に時間がかかっおしたった芁因ずしお、あるネットワヌク゚ンゞニアが元に戻した蚭定を、別の゚ンゞニアが気づかずさらに元に戻す䜜業をしお障害状態に埩垰しおしたう、ずいったこずが散発したため。』
原因はBGPのPolicy蚭定ミスっおのは残念だけど、その埌の切り戻したら、別の゚ンゞニアが気づかずたた障害状態に戻すあたりちょっずおもろいな
Googleずかでも同じようなミスは過去にありたしたが、改めおBGPの運甚は難しいですね。>ミスった時の圱響範囲が半端ない
昚日の。グロヌバルなむンフラだよなあ
米Cloudflareは、2022幎6月21日午埌(日本時間)に発生したネットワヌク障害に぀いおの報告を公開 / 報告によるず障害はBGP(Border Gateway Protocol)の蚭定ミスが原因
>あるネットワヌク゚ンゞニアが元に戻した蚭定を、別の゚ンゞニアが気づかずさらに元に戻す䜜業をしお障害状態に埩垰しおしたう、ずいったこずが散発した
オりフ
実に興味深いですな
途䞭の報告曞の和蚳がほがルヌ語ず化しおいお笑う
> あるネットワヌク゚ンゞニアが元に戻した蚭定を、別の゚ンゞニアが気づかずさらに元に戻す䜜業をしお障害状態に埩垰しおしたう、ずいったこずが散発したため。
(Žω`)
トップレベルの技術者が起こしたミスにケチ぀けるこずは出来ねえっす、、
Cloudflare の障害の件、原因が刀明
こんな感じで迅速に察応できるのがすごい
30分で原因特定、1時間以内に埩旧䜜業完了、正垞埩垰たでは2時間半ほど

ミスが原因ずはいえ、リカバヌが芋事に思ったり
昚日DiscordやPixivに接続出来なくなった件、原因が分かっおきたしたね。
タむトルずURLをコピヌしたした