クラウド系の国際会議IEEE CLOUD 2020参加録

2020年の10月18日から24日までの5日間にわたって、国際会議IEEE World Congress on SERVICES 2020（IEEE SERVICES 2020）がオンライン形式で開催された。 IEEE SERVICESは、IEEE Computer Societyにより2004年から開催されている「サービスコンピューティング」全般に関連するトピックを扱う複数の国際会議が共催されるイベントとなっている。本来は、7月に北京開催されるはずだったが、COVID-19の感染拡大の影響により、10月に延期されたのちにオンライン開催される運びとなった。今回開催されたのは次の5つの国際会議、CLOUD/ICWS/SCC/SMDS/EDGEである。

このうちCLOUD 2020を中心とした参加報告を次のスライドにまとめている。

各発表を聴講したところ、多くの発表に共通してみられた特徴として、対象システムとして、クラウド上のマイクロサービス、反応的にスケールするサーバレスコンピューティング、多数のエッジとクラウドの連携といった動的かつ分散した複雑なシステム構成を想定していた。このようなシステムでは、システム管理者によるルールベースの設計や運用が限界となることから、より賢い手法として、待ち行列理論や数理最適化問題などの古典的な数理モデルの適用に加えて、機械学習と深層学習を適用するというアプローチが採られていた。そして、新たにML/DLを適用するというより、すでにそれらを適用した先行研究の課題を解くという段階に入っていた。自分の観測範囲内では、半数以上がこの手の発表だったように感じた。

このスライドでは、まさにそのようなアプローチを採っているIEEE CLOUDのベストペーパー賞を受賞したAnirban Dasらによる「Skedulix: Hybrid Cloud Scheduling for Cost-Efficient Execution of Serverless Applications」の概要を紹介している。 Skedulixは、サーバーレス（FaaS）のプライベートクラウド構成において、Functionのジョブ処理を一部パブリッククラウドにオフロードしたいときに、できるかぎりプライベートクラウドで捌いてコストを最小化したいが、処理時間を悪化させたくないので、パブリッククラウドのFaaSを使ってスケールさせたいという要求に対して、うまくジョブをスケジューリングする手法を提案する研究だった。

また、自分の研究領域に近しい研究として、異常検知と根本原因特定に関する発表を3つ簡単に紹介している。

Deep Unsupervised Workload Sequence Anomaly Detection with Fusion of Spatial and Temporal Features in the Cloud

時系列のメトリックに対して、教師なしで異常を自動検出するために、ディープニューラルネットワークを用いて、シーケンスの本質的な特徴を捕捉し、異常シーケンスの無関係な特徴を分離するという手法がとられている。

RAD: Detecting Performance Anomalies in Cloud-Based Web Services

システムの下位層で取得可能なシステムデータとURL情報のみから、 VMからURLとシステムメトリックを継続的に監視し、キューイングネットワークモデルを構築して、モデルで予測した応答時間を、異常がない場合のモデルで予測されたベースラインとなる応答時間と比較して異常検知を行う。この研究においてはそれほど重要なことではないかもしれないが、待ち行列として扱えるように、システムデータとして、スレッド数などのソフトウェア並列度を取得していたことに興味を持った。

Root-Cause Metric Location for Microservice Systems via Log Anomaly Detection

従来であればメトリックだけで相関分析したり、ログだけで異常検知をしていたが、ログを異常度、つまり数値情報に変換した上で、同じく数値情報であるメトリックと突き合わせて、相関分析するというアプローチが提案されている。メトリックとログをうまく扱いたいとぼんやり思っていたが、テキストと数値の時系列をうまく扱っていておもしろいアプローチだと思った。

オンライン聴講の工夫

事前に英語の論文が配布されるのだが、量が多いので、英語のままで目を通すのはなかなか大変なので、休憩時間に、DeepLを使って、アブストとイントロを日本語に翻訳して、セッションごとに分割したNotionのページに貼り付けておいて、ギャラリービューで一覧できるようにして共有するということをやっていた。これにより、研究の内容がある程度頭に入った状態で、発表を聴くことができた。

発表は当然英語なのだけど、残念ながら英語のリスニングがおぼつかないので、音声をリアルタイムに書き起こしできるサービスであるOtterを使って、英語字幕を表示させて発表を聴いていた。昨年も使っていたが、以前より精度が高まっているように感じた。オンライン聴講では、手元の端末から出力される音声をまた手元の端末に入力する、つまりループバックさせる必要があり、そのためのmacOSでの手順を次のリンクにまとめている。

https://www.notion.so/yuuk1/Listening-Talks-a95698a888634120a3e285c3085ab4f2

2020/10/29 15:50 追記: Otterを利用する場合は、参加するカンファレンスの録音やスクリーンショット撮影の可否を事前に確認しておくとよいでしょう。後日動画が公開されるようなカンファレンスであればおそらくは問題ないのではないかは思います。

所感

クラウドコンピューティングにまつわる課題を機械学習をはじめとした数理的アプローチで解く研究が多数発表されたことから、現在取り組んでいる研究の発表の場として適切であると感じた。このような研究が多数発表されているにも関わらず、未だ現場ではルールベースの運用がなされていることから、実環境への適用可能性に重視して研究していこうという気持ちになった。

同僚のまつもとりーさんも一緒に参加していろいろ感想を書かれているので、そちらも参照してみてほしい。 https://matsumotory.hatenadiary.jp/entry/2020/10/24/232547

過去の参加報告

国内の学術雑誌に寄稿されていたIEEE SERVICESの参加報告を参考にさせていただいた。

千葉立寛, IEEE SERVICES/CLOUD 2018 参加報告, コンピュータソフトウェア, Vol.36, No.1, pp.74-78, 2019.
中澤里奈, IEEE SCF 2017/CLOUD 2017参加報告, コンピュータソフトウェア, Vol.34, No.4, pp.75-78, 2017.
勝野恭治, IEEE CLOUD 2016参加報告, コンピュータソフトウェア, Vol.34, No.2, pp.75-78, 2017.