工学としてのSRE再訪 - SRE NEXT 2024登壇後記

この記事では、2024年8月3-4日に開催されたSRE NEXT 2024 IN TOKYOでの自分の講演概要とパネルディスカッションに加えて、セッションでは語りきれなかった話と、登壇を終えての後記、最後にSRE NEXT全体の感想を記します。 SRE NEXT 2024では、公募セッショ…

“LLM for SRE“の世界探索

ChatGPTが登場した当初、対話や要約、翻訳、コード生成などの典型的な言語タスクができても、SREやAIOpsの研究開発にはあまり関係ないのではないかと正直思っていた。AIOpsでは典型的にはいわゆるObservabilityデータ(メトリクス、ログ、トレースなど)が入…

2023年研究開発振り返り

12月半ばに長らく取り組んでいた論文を投稿して気が抜けたのか、年末年始は呆けて過ごしている。気がついたら4日なってもまだ振り返りを書けていなかった。2023年は2022年と比べて自身の変化が少なく、振り返るためのやる気がでなかったのかもしれない。やる…

エンジニアのためのSRE論文への招待 - SRE NEXT 2023

この記事では、2023年9月29日に開催されたSRE NEXT 2023 IN TOKYOでの講演の概要に加えて、講演では触れられなかった部分の補足と、発表を終えての後記、最後にSRE NEXT全体の感想を書きました。

YAPC::Kyotoに参加してきた - 自分の原点を思い出すカンファレンス

3/19(日)開催のYAPC::Kyoto 2023にオフラインで参加してきた。最後にYAPCに参加したのはYAPC::Asia 2015なので、8年ぶりのYAPCだった。自分が登壇しないテックカンファレンスにオフライン参加すること自体がこれまでにほとんどなく、カンファレンスの醍醐…

2022年の研究と生活の振り返り

今年は特になにかあるわけでもないけど、どことなく落ち着かない年末を過ごしている。8年間通っている近所の食堂の餅つき会に呼んでいただいて、幼少のころ以来久しぶりに、餅をつかせていただいたりした。今年は、華々しい出来事はなく、アトリエにこもって…

SRE NEXTで「AIOps研究録」講演を終えて

5月14-15日に開催されたSREの国内カンファレンス SRE NEXT 2022 ONLINEにて、「AIOps研究録―SREのためのシステム障害の自動原因診断」と題して、ITシステムに障害が発生した際に、機械学習・統計解析の手法を用いて、障害の原因を自動で診断するための研究に…

2021年の研究回想

この年末は、ブログ記事をしたためながら、大阪の新オフィスで受領したM1 MacBook Proをセットアップしながら過ごしている。京都では寒波が厳しく、底冷えするような寒さがあり、天気予報で予報されている気温よりも寒く感じる。大晦日に実家に帰り、年始に…

Linux eBPFトレーシング技術の概論とツール実装

eBPF(extended Berkley Packet Filter)という用語を著者が初めてみかけたのは、2015年ごろだった。最初は、eBPFをその字面のとおり、パケットキャプチャやパケットフィルタリングを担うだけの、Linuxの新しいサブシステムであろうと認識していた。しかし、…

分散アプリケーションの依存発見に向いたTCP/UDPソケットに基づく低負荷トレーシング

この記事は、分散アプリケーションを構成するネットワークサービス間の依存関係マップを構築するための基礎技術の改善提案をまとめたものである。第8回WebSystemArchitecture研究会での発表と同等の内容であり、そのときのスライドを以下に掲載しておく。 ま…

2020年の研究振り返り

今年は、エンジニアから研究者になって2年目になる。 社会情勢の変化を除いては、さくらインターネット研究所での研究活動の一貫として、京大情報学研究科の博士課程に進学したことが最も大きな変化だった。 とはいえ、博士課程ではなにか特別新しいことをや…

Redis Clusterとgo-redisの深刻な性能劣化を解決した話

さくらインターネット Advent Calendar 2020の23日目です。 現時点では最新版のRedis 6.0のRedis Clusterに対して、Go言語の代表的なRedisクライアントライブラリであるgo-redisからアクセスしたときに、性能が深刻なレベルで劣化しました。 この記事では、…

マイクロサービスにおける性能異常の迅速な診断に向いた時系列データの次元削減手法

著者 坪内 佑樹(*1), 鶴田 博文(*1), 古川 雅大(*2) 所属 (*1) さくらインターネット株式会社 さくらインターネット研究所、(*2) 株式会社はてな 研究会 第7回Webシステムアーキテクチャ研究会 2010年代のクラウド技術であるコンテナオーケストレーション、…

クラウド系の国際会議IEEE CLOUD 2020参加録

2020年の10月18日から24日までの5日間にわたって、国際会議IEEE World Congress on SERVICES 2020(IEEE SERVICES 2020)がオンライン形式で開催された。 IEEE SERVICESは、IEEE Computer Societyにより2004年から開催されている「サービスコンピューティン…

さくらインターネット研究所での1年

さくらインターネット株式会社に昨年の2月に入社してから1年(と2ヶ月)が経過した。さくらインターネット研究所での研究員としての新しい働き方にも慣れてきた。論文や口頭発表などの締切も落ち着いてきたので、ここまでの1年を振り返ってみる。 やりたいこと…

SRE NEXT基調講演を終えて

1月25日に開催されたSRE NEXT 2020 IN TOKYOにて、「分散アプリケーションの信頼性観測技術に関する研究」と題して、基調講演をさせていただきました。 これまで一環してWebオペレーション・SREに取り組んできて、今ではSRE Researcherと名乗っている身から…

2019年振り返り - エンジニアから研究者へ

例年のように、昨年の活動を振り返る。 昨年は、それ以前の5年と異なり、働き方もエンジニアから研究者へ転向したことにより、自分を取り巻く環境は大きく変化した。 とはいえ、1年の研究活動を通じて、エンジニア時代と比較し、働き方は変わっても、自分が…

Webシステムアーキテクチャの地図を描く構想

この記事は第5回Webシステムアーキテクチャ研究会の予稿です。 はじめに Webサービスにおいては、スマートフォンの普及によるアクセス増加に対してスケーラビリティを持ち、個人向けだけでなく企業向けサービスの可用性の要求に耐えられるようなシステム設計…

サーバーレスアーキテクチャ再考

2014年にAWS Lambdaが登場し、Functionを単位としてアプリケーションを実行する基盤をFunction as a Service(以下、FaaS)と呼ぶようになった。 そして、同時にサーバーレスアーキテクチャ、またはサーバーレスコンピューティングと呼ばれる新しいコンセプト…

はじめて国際会議で論文発表して考えたこと

先日、アメリカのウィスコンシン州ミルウォーキーで開催された国際会議 IEEE COMPSAC 2019で時系列データベースHeteroTSDBの論文を発表してきました。 IEEE COMPSACは、IEEE内のコンピュータソフトウェア分野の分科会IEEE Computer Societyのフラグシップカ…

エッジコンピューティングに向けた分散キャッシュ技術の調査

著者: 坪内佑樹(*1) 所属: (*1) さくらインターネット株式会社 さくらインターネット研究所 研究会: Web System Architecture研究会#4 はじめに Webサービスの応答速度を向上させることにより,ユーザーの体験が向上することが知られている. 実際に,40%以…

エッジコンピューティングを活かしたウェブアプリケーションホスティング構想

さくらインターネット研究所では、超個体型データセンターというコンセプトに則り、あらゆるデバイスと場所がデータセンターとなり、各データセンターが有機的に結合した集中と分散のハイブリッド構造をもつコンピューティングを目指している。 超個体型デー…

2019年SRE考

SRE

この記事では、自分が数年Site Reliability Engineering (SRE)を実践しつつ、SREについて考えてきたことをまとめる。 先月開催されたMackerel Drink Up #8 Tokyoと先日開催された次世代Webカンファレンス 2019では、SREについて集中的に議論する機会に恵まれ…

2019年の展望

どうでもいいけど、今日から真の無職になった。年末は珍しく、毎日おいしい日本酒を飲んだり、バーに行ったり、新幹線に置き忘れたiPhoneを買い換えたり、10年ぶりのLinuxデスクトップ環境構築をしていたり、友人・知人とゆっくり話をしていた。連絡をもらえ…

株式会社はてなを退職しました

2018年12月21日の今日がはてなでの最終出社日となりました。 はてなには、2013年12月に新卒として入社し、その後5年間に渡りお世話になりました。 はてなとの出会いのきっかけは、2011年のはてなインターンに参加したことでした。 はてなインターンの特徴の…

時系列データベースの論文を書いた

先週、第11回インターネットと運用技術シンポジウム (IOTS2018)にて、投稿した論文の発表をしてきました。 IOTSは査読付の国内の研究会であり、2年前に招待講演をさせていただいた研究会でもあります情報処理学会でウェブオペレーション技術について招待講演…

TCP接続の追跡による簡略化したネットワーク依存関係グラフの可視化基盤

著者: 坪内佑樹(*1), 古川雅大(*1) 所属: (*1) 株式会社はてな 研究会: Web System Architecture研究会#3 はじめに ウェブシステムは,一般的に,分散したホスト上で動作するソフトウェアが互いにネットワーク通信することにより構成される. 相互にネットワ…

サーバレス時代におけるヘテロジニアス時系列データベースアーキテクチャ

この記事は、第2回ウェブシステムアーキテクチャ研究会の予稿です。 ウェブシステムをモニタリングするために、高可用性、高書き込みスケーラビリティ、メトリックの長期保存が可能な時系列データベースが求められている。 これらを実現するために、性能特性…

DynamoDBのインフラコストの構造と削減策

Amazon DynamoDBは、RDSのようなインスタンスサイズによる課金モデルではなく、ストレージのデータ使用量とスループットを基にした課金モデルになっている。 インスタンスサイズによる課金モデルでないデータストア系サービスとして、他にはS3、Kinesisなど…

Webサービスをデータセンター移行するときに必要となる技術要素

クラウドへの移行を含むデータセンター(以下DC)移行事例を基に、WebサービスをDC移行するための基本的な技術要素を紹介します。具体的には移行手順、データベースのデータ移行、ネットワーク、DNSなどです。 最近、社内で大規模なDC移行を実施しつつあり、DC…