Kengo Ohta

太田 健吾 / Kengo Ohta (ota)

阿南工業高等専門学校 准教授 / 豊橋技術科学大学 客員准教授。博士(工学)。

音声言語処理、自然言語処理、AI の教育応用について研究しています。

researchmap · GitHub

AIに関する共同研究や技術相談を受け付けています。
(例. 音声AIアプリ、LLMの導入、チャットボット構築、教育向けAIシステム)
まずはお気軽にメールでご相談ください: kengo [at] anan-nct.ac.jp

所属

阿南工業高等専門学校 創造技術工学科 情報コース 准教授
豊橋技術科学大学 大学院工学研究科 客員准教授 (音声言語処理研究室
株式会社 Harmonized Interactions 取締役

主要な研究業績

End-to-End Spontaneous Speech Recognition Based on Disfluency Labeling
K. Horii, M. Fukuda, K. Ohta, R. Nishimura, A. Ogawa, N. Kitaoka
IEICE Trans. Inf. & Syst., 2026
フィラーや言い淀みを含む話し言葉音声の認識精度を改善するために、フィラーや言い淀みを記号ラベルで表現し、 End-to-End 音声認識モデルに明示的に学習させる手法を提案しました。

Domain Adaptation Using Non-Parallel Target Domain Corpus for Self-Supervised Learning-Based ASR
T. Kinouchi, A. Ogawa, Y. Wakabayashi, K. Ohta, N. Kitaoka
Speech Communication, 2025
音声認識モデルを特定のドメインに適応させる際に、目標ドメインの音声データのみを用いて自己教師あり音声認識モデルを適応する手法を提案しました。

Backchannel Prediction for Natural Spoken Dialog Systems Using General Speaker and Listener Information
Y. Fukunaga, R. Nishimura, K. Ohta, N. Kitaoka
Interspeech 2025
自然な音声対話システムを実現するために、個人識別情報に依存しない汎用的な話し手・聞き手のベクトル表現を用いて、相槌の種類を予測する手法を提案しました。

Improving Speech Recognition for Japanese Deaf and Hard-of-Hearing People by Replacing Encoder Layers
K. Takahashi, Y. Wakabayashi, K. Ohta, A. Kobayashi, N. Kitaoka
ICAICTA 2024, Best Paper Award
聴覚障害者による日本語発話音声の認識精度を改善するために、健常者音声で事前学習した音声認識モデルのエンコーダ層を聴覚障害者音声向けに置き換える適応手法を提案しました。

Boosting CTC-based ASR Using Inter-layer Attention-based CTC Loss
K. Hojo, Y. Wakabayashi, K. Ohta, A. Ogawa, N. Kitaoka
Interspeech 2024
高速推論が可能な CTC ベース音声認識モデルの精度向上を目的として、Transformer エンコーダの各層出力をアテンションで重み付けして学習に利用する層間 CTC 損失を提案しました。

Recognition of Target Domain Japanese Speech Using Language Model Replacement
D. Mori, K. Ohta, R. Nishimura, A. Ogawa, N. Kitaoka
EURASIP Journal on Audio, Speech, and Music Processing, 2024
End-to-End 音声認識モデルを目標ドメインに適応させるために、ベイズ定理に基づいて音声認識モデルに内在する言語情報を置換する手法を提案しました。

Response Type Selection for Chat-like Spoken Dialog Systems Based on LSTM and Multi-task Learning
K. Ohta, R. Nishimura, N. Kitaoka
Speech Communication, 2021
雑談音声対話システムにおける応答タイプ選択の精度を向上させるために、ユーザ発話の単語系列を LSTM で処理し、マルチタスク学習により応答タイプを分類する手法を提案しました。

Text-to-speech system for low-resource language using cross-lingual transfer learning and data augmentation
Z. Byambadorj, R. Nishimura, A. Ayush, K. Ohta, N. Kitaoka
EURASIP Journal on Audio, Speech, and Music Processing, 2021
学習データの少ない低資源言語の音声合成を実現するために、英語・日本語の大規模コーパスで事前学習したモデルに対して、言語を横断した転移学習とデータ拡張を組み合わせました。

主要な受賞

ACC TOKYO CREATIVITY AWARDS ACCゴールド クリエイティブイノベーション部門 (2022)
Artificial Emotional Intelligence “Saya”の音声合成の研究開発を担当しました。

国立高等専門学校教員顕彰 若手部門 理事長賞 (2022)
卒研生の研究指導や高専プロコン・ロボコンの指導を中心とする教育業績により、全国51校55キャンパスの国立高専から推薦された候補者の中の上位4名に選ばれました。

外部資金

電力制約のある学校環境下で動作可能な教育DXアシスタント基盤のための
音声言語エッジAI基盤

中部電気利用基礎研究振興財団 研究助成、2026–2028、代表、R-07218

教育効果を考慮した大規模音声言語モデルに基づく教材生成AIの構築
科研費 基盤研究(C)、2024–2027、代表、24K06322

高齢者を対象とした永続的に利用できるマルチモーダル対話システム基盤技術の構築
科研費 基盤研究(A)、2023–2027、分担、23H00493

人間の感覚と整合する音声特徴空間の構築
科研費 挑戦的研究(萌芽)、2022–2025、分担、22K19793

画像と音声、対話履歴などを利用した対話システムの構築
共同研究(民間企業)、2021–2025

オンライン講義の学びを活性化するソーシャルアノテーションに基づく講義要約システム
科研費 若手研究、2021–2024、代表21K13641

プレゼンテーションスキルの向上を支援する模範音声の自動生成システム
科研費 若手研究、2018–2021、代表、18K18170

認知力トレーニングを目的とした事例ベース雑談音声対話システムの研究開発
総務省 SCOPE、2017–2019、分担

自然な発話による音声インタラクションのための言語モデルに関する研究
科研費 特別研究員奨励費(DC2)、2011–2012、代表、11J07766