CyberAgent秋葉原ラボでインターンしてきました

はじめに

2月初旬〜2月末の約1ヶ月間、CyberAgent秋葉原ラボでインターンしてきました。その感想を書きたいと思います。

秋葉原ラボってどういうところ?

秋葉原ラボは大規模データ処理やデータ分析、機械学習などを専門とするエンジニアが在籍する研究開発組織です。サイバーエージェントのメディアサービスから得られるデータを活用することで、メディアサービスと会社の発展に寄与することを目的として2011年4月、秋葉原にオフィスを開設しました。
サービスから日々生成されるユーザーのアクセスログや行動ログなどを大規模に集積、処理する基盤を整備し、その基盤上のデータを機械学習自然言語処理技術などを用いてサービスに活かせるシステムを構築、提供しています。
また、基盤上のデータを分析、マイニングすることによりサービスやユーザーの状況を把握し、サービス拡大および健全化を図る基礎を担っています。

 

www.cyberagent.co.jp

 

僕はこの開発組織の中でも自然言語処理を担当する班に所属させて頂きました。

 

秋葉原ラボでしていたことは?

僕は面接の時からやりたいことを伝えていて、希望通りのことをやらせて頂きました。具体的には、AbemaTVのコメントの雰囲気を良くするために、以下のようなタスクを行いました。

・通報されたコメントからNGワード・フレーズの抽出

・通報されてもおかしくないユーザーの抽出

本当はもっと色々なことをやりたかったのですが、時間が足りなかったです。 

 

僕はB3で、自然言語処理は専門ではないのですが、希望したことをさせて頂きました(しかも院進するので、21卒じゃない)。基本的には一人で作業を進めることが求められると思います。でも、メンターさんが具体的な手法や方向性を一緒に考えてくれるので、なんとかなりました。

 

最後には、最終成果発表(20~30分)があり、スライドを70枚ぐらい作成しました。こんなにスライドを作るのが大変とは知らなかった…

 

他にどういったイベントがあった?

オフィス見学

渋谷にあるアベマタワーズ内を見学できました。

絵を描いている人の仕事姿にカッコいいなぁと思いました。

 

懇親会

希望者だけで、懇親会がありました。この時に、人事の方に質問したり、他のインターン生がどういったことをやっているのか知れたりしました。なんかアニメの話をしていたことを一番鮮明に覚えています。

 

f:id:maguroHate:20200213205124j:plain

 

メンター面談

進路の相談や質問ができました。中々フィードバックが貰えない、自分を面接した時にどう感じたかを質問するのがオススメです。また、インターンシップでもっとして欲しいことを伝えることができました。

 

人事面談

最初の面談で設定した目標(例えば、会社のことをもっと知りたい)が達成できているかを確認しました。この時にも、インターンシップでもっとして欲しいことを伝えることができました。

 

所属している班のミーティングに参加

同じ班の社員の方々が、どんなお仕事をされているか詳しく知ることができました。

 

シャッフルランチや同じ部署の方とのお昼ご飯

同じ部署や他の部署で働いている社員の方と一緒にお昼ご飯を食べることができました。色々な方に質問できてありがたかったです。

 

f:id:maguroHate:20200225153703j:plain

f:id:maguroHate:20200227123718j:plain

f:id:maguroHate:20200221124426j:plain

 

スマブラ大会

仕事終わりに、社員の方々とスマブラをやりました。社員の方とは10歳以上離れていると思うのですが、友人と一緒にスマブラとやっているのと変わりませんでした。

 

他にも様々なイベントがありました。 

お仕事を通じてどう感じた?

  • やっぱりデータの前処理がとても大事だなと感じました。もっとPandasや内包記法を使いこなすことができるようになりたいと思いました。 

 

  •  タスク「通報されたコメントからNGワード・フレーズの抽出」をやっていく中で、考察がとても大事だなと感じました。考察を通じて、一つ一つ問題を解決していくことで、少しずつNGワード・フレーズが抽出されるようになっていきました(フレーズとなるとかなり難しくなることもよく感じました)。また、考察をして、問題を解決するには、先行研究を調べることや専門性の高い知識が大切だなと感じました。

 

  •  わかりやすい発表をするには、練習することが大事だということがわかりました。スライドには喋ることを全部書くわけではないので、伝えたいことを事前に決めて、何回か練習するのが大切だなと感じました。

 

  • 作ったモデルやシステムを評価することは難しいことだと感じました。アノテーションで評価をするとどうしても主観的かつ作業が大変になることを感じました。なので、アノテーションをする時は、アノテーションをする際の定義をしっかりすることとできるだけ複数人でやることが大事だと感じました。

 

色々な方に質問してどう感じた?

  • 基本と専門性が大事だなぁと感じました。自分はB3で専門性がないので、研究室で専門性を身に付けたいと思いました。また、基本を身に付けるためのオススメの本・方法を色々と教えて頂きました。

 

  • 自分はデータサイエンスとバックエンドのどちらもできる人材になりたいと思っていました。しかし、今回のインターンを通じて、データサイエンスとバックエンドのどちらを専門にするかをちゃんと決められていなかったと感じました。バックエンド側の勉強をよりしてみて、ちゃんと専門を決めたいです。

 

今後はどうする?

  • とりあえずは就活の時に何が専門かを言えるようにしたいです。なので、今後やっていく卒論を通じて、専門を決めたいです。

 

  • 研究室のサーバの環境構築や管理を積極的にやりたいと思いました。メンターさんも大学生の頃にこれをやっていたおかげで色々な知識を得られたと仰いていたので、自分もその知識を得たいです。

 

  • 今まではデータサイエンスの勉強をメインにしてきたので、バックエンドの知識を増やしていきたいです。春休みの間は以下の本を読むつもりです。

f:id:maguroHate:20200301171908j:plain

 

東京での思い出

休日は観光していました。


 

f:id:maguroHate:20200215173144j:plain

f:id:maguroHate:20200215163154j:plain

f:id:maguroHate:20200215171931j:plain

f:id:maguroHate:20200215170817j:plain

f:id:maguroHate:20200208141919j:plain

f:id:maguroHate:20200216153417j:plain

f:id:maguroHate:20200216152847j:plain

f:id:maguroHate:20200216155741j:plain

しばらく二郎ラーメンはいいです(サイバーエージェントでこのネタを何回やったかわからない)

f:id:maguroHate:20200209172034j:plain

 

サイバーエージェントの皆様、特にメンターさんお世話になりました。ありがとうございました。楽しかったです。

f:id:maguroHate:20200228210205j:plain