所属組織 |
大学院工学研究院 知的構造の創生部門 |
職名 |
教授 |
研究キーワード |
コミュニケーション科学、マルチモーダルインタラクション、社会的信号処理 |
学歴 【 表示 / 非表示 】
-
2005年4月-2007年3月
名古屋大学 情報科学研究科 メディア科学 博士課程 修了
-
1993年4月-1995年3月
横浜国立大学 工学研究科 電子情報工学 修士課程(博士前期課程) 修了
-
1989年4月-1993年3月
横浜国立大学 工学部 電子情報工学科 卒業
学内所属歴 【 表示 / 非表示 】
-
2024年10月-現在
専任 横浜国立大学 大学院工学研究院 知的構造の創生部門 教授
-
2020年4月-2024年9月
専任 横浜国立大学 大学院工学研究院 知的構造の創生部門 准教授
学外略歴 【 表示 / 非表示 】
-
2012年10月-2020年3月
日本電信電話株式会社 コミュニケーション科学基礎研究所 主幹研究員
-
2007年4月-2012年9月
日本電信電話株式会社 コミュニケーション科学基礎研究所 主任研究員
-
2003年4月-2007年3月
日本電信電話株式会社 コミュニケーション科学基礎研究所 研究主任
-
2001年4月-2003年3月
日本電信電話株式会社 コミュニケーション科学基礎研究所 社員
-
1999年12月-2001年3月
日本電信電話株式会社 サイバーソリューション研究所 社員
所属学協会 【 表示 / 非表示 】
-
2022年4月-現在
人工知能学会
-
2005年-現在
IEEE(Institute of Electrical and Electronics Engineering)
-
1996年-現在
電子情報通信学会
-
1996年-現在
情報処理学会
論文 【 表示 / 非表示 】
-
Ito, K; Ishii, Y; Ishii, R; Eitoku, SI; Otsuka, K
IEEE ACCESS 12 96769 - 96782 2024年7月 [査読有り]
記述言語:英語 掲載種別:研究論文(学術雑誌) 共著
-
言語特徴を利用した対話中の頭部運動機能の認識
城戸 祐世, 杉山 隼大, 大塚 和弘
電子電子情報通信学会論文誌A 基礎・境界 J107-A ( 1 ) 6 - 18 2024年1月 [査読有り]
記述言語:日本語 掲載種別:研究論文(学術雑誌) 出版者・発行元:電子情報通信学会 共著
対話において,頷きや首振りなどの頭部運動は,様々重要な機能を担うことが知られている.従来,頭部運動からその機能を認識するための畳み込みニューラルネット(CNN)が提案されている.本論文では頭部運動機能の認識性能の向上を目指し,頭部運動に加えて新たに言語特徴を入力とするモデルを提案する.このモデルは言語・非言語情報を統合するため,各々の特徴を表現する埋め込みベクトルを算出し,これらを全結合ニューラルネットに入力するというモデル構造をもつ.頭部運動に関して,既存のCNNの中間層出力を特徴ベクトルとして利用する.言語特徴として,BERTに基づく時間粒度の異なる3種の特徴表現として,トークン単位,及び,発話区間単位の埋め込みベクトル,並びにトークン系列の動的特性をLSTMを用いて表現したベクトルを比較検討する.実験の結果,トークン単位の言語特徴を用いたモデルにより頭部運動機能10種の平均で4.7ポイントのF値の向上が確認された.また,「相槌」の認識において,発話区間単位の言語特徴を用いたモデルにより最大10.4ポイントのF値の向上を達成した.これらより頭部運動機能認識において言語特徴が有効な手がかりとなることが示唆された.
-
マルチモーダル非言語行動に基づく対話者の視線機能の認識
田代 絢子, 今村 まい, 熊野 史朗, 大塚 和弘
電子電子情報通信学会論文誌A 基礎・境界 J106-A ( 12 ) 296 - 311 2023年12月 [査読有り]
記述言語:日本語 掲載種別:研究論文(学術雑誌) 出版者・発行元:電子情報通信学会 共著
人の対話における視線の機能に焦点を当て,これを対話者の非言語行動から認識するための研究の枠組みを提案する.対話において視線行動は,他者を観察する以外にも,感情・態度の表出や対話の流れの調整などの重要な役割を果たす.従来,対話中の対人視線方向を頭部姿勢や眼球方向などから推定する方法が提案されているが,視線の機能を認識の対象とした取り組みはまだ行われていない.そこで本論文では視線機能の認識という新たな問題を設定し,その解決の枠組みを示す.まず最初に43種の視線機能を定義し,対話中の時刻ごとに各機能の有無を非排他的に記述したコーパス,及び,その分析例を示す.次に14種の視線機能を対象とし,これを対話者の非言語行動から認識する深層学習モデルを提案する.具体的には入力モダリティとして,頭部運動,発話状態,注視状態,眼球方向,及び,顔表情を用い,各々の視線機能の有無の認識を行う畳み込みニューラルネット(CNN)を提案する.実験の結果,14機能の平均認識性能(F値)がチャンスレートから0.243の大幅な向上を遂げ,また,他者を見ながら傾聴するという機能において,最高0.839のF値を達成するなど,視線機能の認識可能性が示唆された.
-
対話中の頭部運動機能がもつ解釈の曖昧性を推定する深層回帰モデル
武田 一輝, 今村 まい, 大塚 和弘
電子電子情報通信学会論文誌A 基礎・境界 J106-A ( 10 ) 255 - 266 2023年6月 [査読有り]
記述言語:日本語 掲載種別:研究論文(学術雑誌) 出版者・発行元:電子情報通信学会 共著
対話者の頭部運動は相槌や相手に対して反応を促す等,多様な機能を担うが,その表出や解釈には曖昧性が伴う.従来,それらの機能を認識するため,複数の観察者による解釈を集約した2値データを訓練データとして用い,機能の有無を認識する畳み込みニューラルネット(CNN)が構築されているが,観察者の評定値の論理和が正解とされ,機能の曖昧性を十分に捉えることができなかった.そこで本論文では,この機能の曖昧性を,複数の外部観察者による評定値の平均値と標準偏差により捉え,前者を機能の表出明瞭度,後者を解釈多様性と定義し,これらを頭部姿勢角の時系列などから推定する回帰問題として定式化する.その解法として,本論文では,畳み込みニューラルネット(CNN)に着目し,表出明瞭度と解釈多様性を同時に推定するCNNモデル(μ-σ CNNと呼ぶ)を提案する.このモデルの性能を表出明瞭度と解釈多様性をそれぞれ単独に推定するCNN回帰モデルと比較した結果,同時推定を行うμ-σ CNNが,単独推定を行うモデルよりも高い推定性能を発揮する可能性があることが確認された.これらの実験結果より頭部運動機能の曖昧性の推定可能性が示唆された.
-
頭部運動機能特徴に基づく対話者の主観的印象の予測・説明モデルの構築
大土 隼平, 三好 一輝, 石井 陽子, 石井 亮, 永徳 真一郎, 大塚 和弘
人工知能学会論文誌 38 ( 3 ) H-M74_1 - 13 2023年5月 [査読有り]
記述言語:日本語 掲載種別:研究論文(学術雑誌) 出版者・発行元:一般社団法人 人工知能学会 共著
<p>An explainable model is proposed to automatically explain when and what kind of behaviors affected interlocutors’ impressions in group discussions. Focusing on self-reported scores on the impressions such as atmosphere and enjoyment felt during the discussions, we tackle a new problem that identifies both influential behaviors and their timings that were related to impression formation. To that end, this paper formulates the problem as the identification of behavioral features, which contributed to the impression prediction and the detection of the timings when such behaviors occurred very frequently. To solve this problem, this paper presents a two-fold framework consisting of a prediction model using random forest regressors, followed by an explanation model using a SHAP analysis. The prediction part employs functional head-movement features, which can capture the various aspects of interactive conversational behaviors. The key feature of the latter explanation part is the temporal decomposition of features’ contributions by integrating the SHAP values and the temporal distributions of the occurrence probabilities of the behavioral features, which were computed by a kernel density estimation method from the detected samples of head movements and their functions. To derive this process, we exploit the dual additivity in the SHAP values and the functional head-movement features over time. Finally, the influential behaviors and their timings are identified from the temporal local maximums of the features’ contribution distributions. Targeting 17-group 4-female discussions included in a SA-Off corpus, this paper shows some case studies and the results of quantitative evaluations, which compared the reported overall scores and two-minute-wise scores at the timings found by the model. These results confirmed the predictability and explainability of the proposed model.</p>
総説・解説記事等 【 表示 / 非表示 】
-
非言語情報が生み出すコミュニケーションのリアリティ
大塚和弘
NTT研究所発 触感コンテンツ専門誌ふるえ 8 ( 5 ) 2016年12月 [依頼有り]
記述言語:日本語 掲載種別:記事・総説・解説・論説等(その他) 単著
-
Prediction of "Who Will Be Next Speaker and When" in Multi-Party Meetings
Ryo Ishii, Kazuhiro Otsuka, Shiro Kumano, Junji Yamato
NTT Technical Review 13 ( 7 ) 2015年 [依頼有り]
記述言語:英語 掲載種別:機関テクニカルレポート,技術報告書,プレプリント等 共著
-
The Future of Idobata Kaigi (“Congregation at the Well”): Realizing Natural Conversations with Distance Access
Kazuhiro Otsuka, Nobuhiro Furuyama, Mayumi Bono
NII Today 48 6 - 7 2014年1月 [依頼有り]
記述言語:英語 掲載種別:機関テクニカルレポート,技術報告書,プレプリント等 共著
-
遠隔地間でも自然な会話を実現する、未来の井戸端会議とは
大塚和弘,古山宣洋,坊農真弓
国立情報学研究所 NII Today 62 6 - 7 2013年12月 [依頼有り]
記述言語:日本語 掲載種別:機関テクニカルレポート,技術報告書,プレプリント等 共著
-
MM-Space: Recreating Multiparty Conversation Space by Using Dynamic Displays
Kazuhiro Otsuka
NTT Technical Review 10 ( 11 ) 2012年11月 [依頼有り]
記述言語:英語 掲載種別:機関テクニカルレポート,技術報告書,プレプリント等 単著
受賞 【 表示 / 非表示 】
-
2023年12月 電子情報通信学会 HCGシンポジウム2023 複数モダリティの非言語情報に基づく対話者の視線機能の分析と認識
受賞者:田代絢子、今村まい、熊野史朗、大塚和弘 -
2022年01月 電子情報通信学会 ヒューマンコミュニケーション基礎研究専門委員会 「対話中の非言語行動の機能スペクトラム解析に向けて〜頭部運動を対象とした機能コーパスと深層学習モデルの構築事例〜」
受賞者:大塚和弘 -
情報処理学会論文誌ジャーナル特選論文賞
2021年01月 情報処理学会 話者継続・交替時における対話行為と視線行動に基づく共感スキルの推定
受賞者:石井 亮, 大塚和弘, 熊野史朗, 東中竜一郎, 青野裕司 -
電子情報通信学会 HCGシンポジウム2018 特集テーマセッション賞
2018年12月 電子情報通信学会
受賞者:石井 亮,大塚和弘,熊野史朗,東中竜一郎,富田準二
研究発表 【 表示 / 非表示 】
-
対話中の頭部運動機能の解釈の曖昧性を推定する深層回帰モデルの検討
武田 一輝, 大塚 和弘
第21回情報科学技術フォーラム(FIT2022)
開催年月日: 2022年9月
記述言語:日本語 会議種別:口頭発表(一般)
-
複数人対話における深層転移学習による頭部運動相互作用の機能認識
森 駿志, 大塚和弘
電子情報通信学会HCGシンポジウム2021 2021年12月 電子情報通信学会
開催年月日: 2021年12月
記述言語:日本語 会議種別:口頭発表(一般)
-
Shumepi Otsuchi, Yoko Ishii, Momoko Nakatani, Kazuhiro Otsuka
23rd ACM International Conference on Multimodal Interaction (ICMI2021) 2021年10月 ACM
開催年月日: 2021年10月
記述言語:英語 会議種別:ポスター発表
開催地:Montreal, Canada 国名:カナダ
-
Takashi Mori, Kazuhiro Otsuka
23rd ACM International Conference on Multimodal Interaction (ICMI2021) 2021年10月 ACM
開催年月日: 2021年10月
記述言語:英語 会議種別:ポスター発表
開催地:Montreal, Canada 国名:カナダ
-
Inflation-Deflation Networks for Recognizing Head-Movement Functions in Face-to-Face Conversations
Kazuki Takeda, Kazuhiro Otsuka
23rd ACM International Conference on Multimodal Interaction (ICMI2021) 2021年10月 ACM
開催年月日: 2021年10月
記述言語:英語 会議種別:ポスター発表
開催地:Montreal, Canada 国名:カナダ
学会誌・論文誌編集等 【 表示 / 非表示 】
-
電子情報通信学会論文誌D
編集委員
2010年5月-2014月6日 -
情報処理学会 コンピュータビジョンとイメージメディア論文誌
編集委員
2004年4月-2008月7日
担当授業科目(学内) 【 表示 / 非表示 】
-
2024年度 システム設計実習
大学院理工学府
-
2024年度 先端情報システムⅡ-F
大学院理工学府
-
2024年度 先端情報システムⅡ-S
大学院理工学府
-
2024年度 先端情報システムI-F
大学院理工学府
-
2024年度 先端情報システムI-S
大学院理工学府
その他教育活動及び特記事項 【 表示 / 非表示 】
-
2022年09月
-
2021年12月
-
2021年08月
委員歴 【 表示 / 非表示 】
-
情報処理学会 情報規格調査会
2018年07月 - 2020年3月 専門委員
委員区分:学協会
-
電子情報通信学会 ヴァーバル・ノンヴァーバル・コミュニケーション研究会
2016年04月 - 2020年3月 委員長
委員区分:学協会
-
電子情報通信学会 和文論文誌D編集委員会
2010年05月 - 2014年6月 編集委員
委員区分:学協会
-
電子情報通信学会 ヴァーバル・ノンヴァーバル・コミュニケーション研究会
2010年04月 - 2016年3月 副委員長(会計)
委員区分:学協会
-
電子情報通信学会 ヴァーバル・ノンヴァーバル・コミュニケーション研究会
2008年04月 - 現在 専門委員,運営委員
委員区分:学協会