研究室案内(草稿)
国立情報学研究所(NII)では助教から教授まですべて独立して研究室を主宰しますが、助教は一般に入所後5年間の任期(非テニュアトラック)があり「研究室をしっかり構えたとしても、そもそも存続させられるかわからないし……」という感じで本腰を入れられない状況でした。共同研究者のみなさまに恵まれて幸運なことに2024年11月から任期なしとなり、少し腰を据えて研究室としての活動に取り組めるようになりました。近いうち(いつ?)に「国立情報学研究所 計算言語学研究室」みたいな感じのお行儀のよいウェブサイトを作る予定ですが、その準備のために書いているものを少しずつ公開します。
研究テーマ
自然言語処理・計算言語学分野において「言語的な知性をモデリングすることを通じて私たちはなにをしているのか・なにを知ることができるのか」という問いを中心にして、言語学・心理学・哲学などの視点を大事にしながら研究を進めています。現在は大きく分けて以下の3つの話題に取り組んでいます。
- 言語知性の評価とその方法論
- 言語モデルの振る舞いの評価について、データセットの構築やその方法論の改善に取り組んでいます。とりわけ(計量)心理学における測定の妥当性の考え方を言語モデルの評価に適用して見通しを良くすることを目指しています。
- 関連分野:計量心理学(心理測定)、教育学
- 参考資料:
- これまでの研究成果の例:
- Kawabata and Sugawara (EMNLP 2024) Rationale-Aware Answer Verification by Pairwise Self-Evaluation
- Kawabata and Sugawara (EMNLP 2023) Evaluating the Rationale Understanding of Critical Reasoning in Logical Reading Comprehension
- Sugawara and Tsugita (ACL 2023 Findings) On Degrees of Freedom in Defining and Testing Natural Language Understanding
- Ashida and Sugawara (COLING 2022) Possible Stories: Evaluating Situated Commonsense Reasoning under Multiple Possible Scenarios
- Sugawara et al. (ACL 2022) What Makes Reading Comprehension Questions Difficult?
- 人間と言語モデルの言語獲得・言語処理
- 人間と言語モデルの言語獲得や言語処理の対照を通して、人間や言語モデルの言語的な振る舞いの獲得・処理原理を探究します。とりわけ、より人間に近そうな獲得や処理が言語モデルの上でどのように実現可能かという問題に関心があります。
- 関連分野:言語獲得、心理言語学、認知科学
- これまでの研究成果の例:
- 計算言語学の哲学
- 言語モデルの研究を通して私たちがなにをしているのか・なにを知りうるかについて、知性や言語理解の認識論的・存在論的な定義のあり方や科学哲学における科学モデルなどの観点から考えています。同時に、心理学における構成概念との関連も検討しています。
- 関連分野:科学哲学、言語(学の)哲学、認識論
- これまでの研究成果の例:
- 参考文献(もう少しまとまってきたらちゃんと整理します):
- ワイスバーグ『科学とモデル』(2013)
- 戸田山『科学的実在論を擁護する』(2015)
- スレイニー『心理学における構成概念を見つめ直す』(2017)
- ボースブーム『心を測る』(2005)
- Hernández-Orallo, The Measure of All Minds: Evaluating Natural and Artificial Intelligence (2017)
- Nefdt, The Philosophy of Theoretical Linguistics (2024)
研究室に興味がある方
- 大学院生(総研大)
- NII は総合研究大学院大学(総研大)情報学コースに参画しており、5年一貫制博士課程または博士後期課程を受験することになります。入試では書類と面接が審査の対象になります。面接は研究計画のプレゼンテーションが中心ですが、情報科学の基礎的な知識についても問われます。
- 大学院生は NII にリサーチアシスタントとして雇用されて一定の支援を受けられます(月額9-10万円程度)。この雇用に伴って自身の研究に関係のない作業が発生することはありません。
- 自然言語処理・計算言語学を専門とする方のみならず、人文学分野(とくに言語学・心理学・哲学・教育学など)を専門とする方や社会人博士としての進学を目指す方も歓迎します。
- 受験希望者は必ず事前に菅原にご連絡・ご相談ください。
- 参考リンク
- リサーチアシスタント(他大学)
- 他大学に所属する学生(おもに大学院生)はリサーチアシスタントとして雇用されて研究に従事できます。テーマや作業内容は応相談ですが、基本的には本人がやりたいこと・菅原が関心のあることが重なっているような話題を主体的に進めていただく形になります。研究を本格的に始める前に文献調査の期間を設けることが多いです。稼働時間によりますが、半年〜1年でひとつのプロジェクトを進めるのが目安で、最終的に国際会議やジャーナルに論文として成果を発表することを目指します。
- 募集に関する詳細はRA募集をご確認ください。
- これまでの研究成果の例:
- Oba et al. (EMNLP 2024) Can Language Models Induce Grammatical Knowledge from Indirect Evidence?
- Haga et al. (ACL 2024 Findings) Modeling Overregularization in Children with Small Language Models
- Kawabata and Sugawara (EMNLP 2023) Evaluating the Rationale Understanding of Critical Reasoning in Logical Reading Comprehension
- Asami and Sugawara (CoNLL 2023) PROPRES: Investigating the Projectivity of Presupposition with Various Triggers and Environments
- Ashida and Sugawara (COLING 2022) Possible Stories: Evaluating Situated Commonsense Reasoning under Multiple Possible Scenarios
- 特任研究員・ポスドク
- 研究室の予算状況によっては特任研究員の公募を出している・出すことが可能な場合があります。
- 2024年12月現在、2025年4月からの特任研究員を募集中です。Factuality や reasoning に関わるテーマを対象としています。NII越前教授が代表を務める JST K-Program「SYNTHETIQ X: フェイク情報拡散の防御と予防を実現する研究基盤」の菅原グループにおける雇用です。最長4.5年、月給50-70万円程度です。
- 公募の有無にかかわらず特任研究員(ポスドク相当)として採用できることがあります(ただし条件はあまりよくありません)。お問い合わせください。
- 現状 NII では LLM センターの待遇がよいと思います(研究と開発は 50:50 が目安らしい)。
- JSPS PD の受け入れが可能です。
- インターン
- NIIの公式な制度として、年2回の募集で海外の大学の学生をインターンとして受け入れています。
- 国内の学生向けのインターン制度は存在しませんが、3ヶ月〜半年程度で期間を限定した RA としてインターンのように集中的に研究に取り組んでいただくことも可能です(ご相談ください)。
- 外来研究員・特別共同利用研究員
- Visiting Researcher/Student に相当する制度があります。短期滞在も可能です。机が用意できます。
研究環境
- 研究グループとして:あまり規模を大きくせず、各メンバーと丁寧に研究の議論ができる時間を十分に確保することを目指しています。教員もあまり忙しすぎないのが大事かなと思っています。
- 場所:国立情報学研究所は神保町と竹橋の間にあります。神保町はご飯が美味しいお店がたくさんあり、書店がたくさんあり(ただし三省堂書店は工事中で仮店舗)、喫茶店がたくさんあり、個人的にはのんびり過ごせる地域です。竹橋方面に行くと皇居があり、皇居の周りや皇居東御苑を散歩できるのが気分転換にとてもよいです。
- 建物:普通のオフィスビルっぽい建物です。古くもないけど新しくもない。しばらく前に食堂が撤退しました(みんな外に食べに出るし……)。学生・RA・特任研究員には集合部屋の机が割り当てられます(RAで在宅勤務の場合は申請しなければ割り当てられません)。図書室がしっかりしています。皇居側は景色がよいです。
- 備品:PC、モニタ、キーボードなど必要なものは支給します。書籍も購入できます。
- 計算資源:研究室として保有しているサーバは、NVIDIA A100 40GB * 4、A100 80GB * 4、L40S 48GB * 4 の構成です。東大柏キャンパス内にNIIの分館があり、サーバ室があります。GPU が足りないときは必要に応じてクラウドの計算資源を使えるようにしています。
- 所内の他研究室と:自然言語処理を専門とする教員や、隣接分野の教員との連携があります。相澤先生、栗田先生、山岸先生、越前先生など。Pontus Stenetorp 先生(University College London 教授)も特任教員として在籍しています。
- 軽井沢:セミナーハウスがあります。
企業との共同研究や技術相談
- 随時受け付けています。研究室の人員的なエフォートの都合上、共同研究や受託研究よりも技術相談(技術顧問、アドバイザー)の形がお受けしやすいかもしれません。研究テーマに記載しているように、とくに言語モデルの評価に関するご相談が適しているかと思いますが、自然言語処理一般の話題に広く応じています。
- これまでの例:
- 朝日新聞社 メディア研究開発センター アドバイザー、2024年度(研究成果:Kawabata and Sugawara (EMNLP 2024) Rationale-Aware Answer Verification by Pairwise Self-Evaluation、プレスリリース:国際学会「EMNLP」で本社員の論文が2年連続で採択)
非専門家・分野外向けの講演・講義
- 依頼がありましたら遠慮なくご連絡ください。
- これまでの例:
- 三鷹市 市民大学 むらさき学苑(生涯学習講座)、2024年12月
- 長野県産業振興機構・長野高専 善光寺バレー研究成果報告会 特別講演、2024年11月
- 川崎市 かわさき市民セミナー AI講座、2024年6月
- 日本機械学会 IIP部門企画 AI講習会、2024年3月
おまけ
- 神保町1,000円ランチ部(おすすめごはん処のリスト)
- TODO: 便利リンク集みたいなものを作りたいかも