輻輳とは?ネットワークに通信が集中してパフォーマンスが低下する現象

システム開発・テクノロジー
輻輳とは?ざっくりと3行で
  • ネットワークに処理能力を超えた大量の通信が集中してパケットの遅延・廃棄・再送が発生しネットワーク全体のパフォーマンスが著しく低下する状態のこと
  • 大規模なイベント・disaster(災害)時の通話集中・大量アクセス(セール・選挙結果発表)・DDoS攻撃などが原因で発生し「つながらない・重い」という状態の多くは輻輳が原因
  • TCPの輻輳制御(スロースタート・輻輳回避・高速再転送・高速回復)という仕組みがインターネット全体の安定性を維持するために機能しており、ネットワーク工学の重要な概念だ

【深掘り】これだけ知ってればOK!

輻輳の仕組みを理解しよう。ルーターはパケットを受け取るとキューに一時保存して転送する。通信量が処理能力を超えるとキューが満杯になりパケットが廃棄される(パケットロス)。送信側はパケットロスを検出して再送を試みるが、多くの端末が同時に再送を試みるとさらに輻輳が悪化する(輻輳崩壊)。

TCPの輻輳制御の仕組みを理解しよう。TCPにはパケットロスが起きると送信速度を下げる「輻輳制御」が組み込まれている。スロースタート:接続開始時に送信量を少量から始めて指数関数的に増やす。輻輳回避:パケットロスが起きたら送信量を半分に減らして線形に増やす。高速再転送・高速回復:3回の重複ACKを受けたら即座に再転送する。この仕組みによってインターネット全体でトラフィックの公平な分配と輻輳崩壊の防止が実現されている。

Webシステムの観点からの輻輳対策を理解しよう。CDN(コンテンツデリバリーネットワーク):画像・CSS・JSなどの静的コンテンツをエッジサーバーから配信して原点サーバーへのトラフィックを分散する。ロードバランサー:複数のサーバーに負荷を分散してサーバー側の輻輳を防ぐ。レート制限(Rate Limiting):特定のIPやユーザーからの過剰なリクエストを制限する。キューイング・非同期処理:瞬間的なトラフィックスパイクをキューに溜めて処理を平滑化する。

災害時の通話集中による輻輳対策として日本では「災害用伝言ダイヤル(171)」がある。大規模災害時に一般電話回線に輻輳が発生したときに優先的につながる回線として提供されている。また携帯電話では輻輳時にネットワーク側で接続を制限する「規制」が発生することがあり、インターネット通信の方が繋がりやすい状態になることがある。

QoS(Quality of Service)は輻輳時にも重要なトラフィックの品質を維持するための技術だ。音声通話・ビデオ会議などリアルタイム性が必要なトラフィックを高い優先度で処理する。ファイル転送・バックアップなど遅延が許容できるトラフィックは低い優先度で処理する。QoS設定によって輻輳発生時も重要な通信の品質が保たれる。

よくある誤解

輻輳はネットワークの故障だと思っている

輻輳はネットワーク機器の故障ではなく、容量を超えたトラフィックが集中した状態だ。ハードウェアは正常に動いているが処理能力を超えたことで発生する。容量の増強・分散・CDNの活用・QoSの設定が対策となる。

輻輳はインターネット回線を増強すれば解決すると思っている

回線増強は有効な対策の一つだが、輻輳の原因によっては回線増強だけでは解決しない場合がある。サーバー側の処理能力不足・アプリケーションの非効率・集中アクセスへの設計不足が原因の場合は、CDN・ロードバランサー・非同期処理・キューイングなどのシステム設計での対応が必要だ。

会話での使われ方

ITKAGYO運営者デプロイ太郎のアイコン画像

セール期間中にサーバーへのアクセスが集中して輻輳が起きています。急ぎCDNのキャッシュを活用してオリジンサーバーへのリクエストを減らしてください。

インフラエンジニアがECサイトのセール期間中の輻輳に対して即座の対策を指示している場面。

ITKAGYO運営者デプロイ太郎のアイコン画像

このAPIエンドポイント、特定のIPから大量リクエストが来ていて輻輳状態です。レート制限を追加して過剰リクエストをブロックしましょう。

バックエンドエンジニアがAPIの輻輳原因を特定してレート制限による対策を提案している場面。

ITKAGYO運営者デプロイ太郎のアイコン画像

ビデオ会議のトラフィックにQoSで高い優先度を設定しました。輻輳時でも音声・映像の品質が劣化しにくくなります。

ネットワークエンジニアがQoSの設定でビデオ会議の品質を輻輳時も確保できるよう対策した場面。

【まとめ】3つのポイント

  • 処理能力を超えたトラフィック集中でパケットロスと遅延が発生する状態:大規模イベント・災害時の集中アクセス・DDoS攻撃などが原因でネットワークのつながらない・重い状態の多くは輻輳が原因でありCDN・ロードバランサー・レート制限が主な対策だ
  • TCPの輻輳制御がインターネット全体の安定性を支える基盤技術:スロースタート・輻輳回避・高速再転送という仕組みが組み込まれているためTCPは輻輳崩壊を防ぎながら利用可能な帯域を公平に共有する自律分散的なトラフィック管理を実現している
  • QoSでリアルタイム通信を優先して輻輳時も重要な通信の品質を維持:音声通話・ビデオ会議など遅延に敏感なトラフィックを高優先度に設定するQoSで輻輳が発生しても重要な通信への影響を最小化することがエンタープライズネットワークの設計の基本だ

よくある質問

Q
輻輳はどうやって確認しますか?
A

パケットロス率(ping・traceroute・mtr)・遅延(レイテンシ)・スループットの低下をモニタリングツールで確認します。サーバー側はCPU・メモリ・ネットワーク帯域の使用率をDatadog・CloudWatch・Prometheusなどで監視します。

Q
DDoS攻撃と輻輳の違いは何ですか?
A

輻輳は正常なアクセスの集中でも起きる自然な現象です。DDoS攻撃は意図的に大量のリクエストを送りつけて輻輳状態を引き起こすサイバー攻撃です。DDoSは輻輳を攻撃の手段として使います。

Q
TCPの輻輳制御はUDPにもありますか?
A

TCPには輻輳制御が組み込まれていますが、UDPには輻輳制御がありません。そのためUDPを使う音声・動画のリアルタイムストリーミングは輻輳時に品質が劣化しやすいですが、遅延が少ないという利点があります。QUIC(HTTP/3の基盤)はUDP上で独自の輻輳制御を実装しています。

Q
輻輳崩壊とは何ですか?
A

輻輳が悪化して多くの端末が再送を繰り返すことで輻輳がさらに悪化し、実際の有効なスループットがほぼゼロになる状態です。1980年代にインターネットで発生した深刻な問題で、TCPの輻輳制御はこの輻輳崩壊を防ぐために開発されました。

この用語と一緒に知っておきたい用語

用語 この記事との関連
ネットワーク ネットワークは関連分野でよく登場する重要キーワードです。複数のコンピュータや機器を結び、互いにデータをやり取りできるようにした網、それがネットワークだ
サーバー サーバーを押さえると本記事の理解がさらに深まります。ネットワークを通じて情報やサービスを提供する側のコンピューターのこと。レストランで料理を運んでくれる給仕係(server)をイメージするとわかりやすいよ
パケットロス 本記事のテーマと実務上セットで使われることが多い用語です。通信で送られるデータの一部が、途中で宛先に届かず失われてしまう現象、それがパケットロスだ
インターネット 本記事のテーマと実務上セットで使われることが多い用語です。インターネットというのは、世界中のコンピュータやネットワークを互いにつなぎ合わせた、巨大なネットワークの集合体のことだよ。
CDN 次のステップとしてCDNを学ぶと知識が広がります。Content Delivery Networkの略で、世界中に配置したサーバー群からコンテンツを届ける「配達拠点ネットワーク」。

【出典】参考URL

https://www.nic.ad.jp/ja/contents/techdocs/tcp-ip.html :JPNICのTCP/IP解説(輻輳制御を含む)
https://www.cloudflare.com/ja-jp/learning/ddos/ddos-attack-tools/slowloris/ :CloudflareによるDDoSと輻輳の解説
https://datatracker.ietf.org/doc/html/rfc5681 :RFC 5681 TCP Congestion Control

コメント

「IT用語、難しすぎて心が折れそう……」という方のための、ハードル低めな用語辞典です。

情報レベルは「基礎中の基礎」。会話を止めないためのエッセンスだけを抽出しています。分かりやすさを追求するあまり、時々例え話が暴走しているかもしれませんが、そこは「ほどよく」聞き流していただけると幸いです。
ほどよくIT用語辞典システム開発・テクノロジー
デプロイ太郎のSNSを見てみる!!