蘑菇短视频

むすぶ、ひらく。 CHUBU Electric Power

むすぶ、ひらく。中部電力グループ
瀬川 修

RESEARCHERS

先端技术応用研究所

瀬川 修

OSAMU SEGAWA

PROFILE

所属 先端技术応用研究所
研究?専门分野 音声言语処理、画像処理
学位 修士(工学)横浜国立大学
博士(工学)名古屋大学(注)入社后、博士课程に在籍し取得
趣味?好きなこと 车、読书、映画鑑赏
研究キーワード 础滨、音声认识、自然言语処理、画像処理、テキストマイニング

(注)2024年7月取材时

瀬川さんの専门分野を教えてください。

言语、音声、画像などの様々なメディアを扱う础滨技术を専门としています。もともと人间の知性の根源である言语というものに兴味があり、言叶をコンピュータで扱う「自然言语処理」や「音声认识」は、学生时代から长期にわたり手がけているテーマです。
最近では画像分野も含め「ディープラーニング」と総称される础滨技术全般を対象とした研究を进めています。これらの先端技术を用いて、电力业务の幅広い支援技术を开発するのがミッションです。

これまで、どんな研究に取り组んできたのでしょうか。

入社以来、研究职として电力分野の业务课题を础滨技术で解决するための研究に取り组んできました。
所属する研究部署では特定の部门にとどまらず、系统、送変电、発电、配电、営业など、幅広い领域の研究开発にたずさわってきました。
まず、「音声认识技术」については电话音声の分析が主要なターゲットで、コールセンターや给电制御所の通话録音を対象として、通话内容のテキスト化と検索を実现するシステムを开発しました。
自然言语処理技术については、主に「テキストマイニング」と総称される言语情报の分析技术の开発をおこなってきました。
テキストマイニング技术のニーズとしては、顾客意见や设备の巡视记録などのビッグデータの分析があり、カテゴリ分类、评判分析、特异事象抽出、因果関係分析など多様な分析ニーズに対応できる汎用性の高いシステムを开発しました。
「画像処理技術」については、本格的に取り組みはじめたのは2010年代からで、主に電力設備の巡視の支援技術の開発をおこなってきました。具体的には、コンピュータで生成した情報を実世界に重ね合わせる可視化技術である「拡張現実(AR)」や、複数の画像情報から物体の3次元点群を推定する「 3次元構造復元」などの要素技術開発をおこないました。
2010年代初头までは要素技术が十分に确立されておらず、ニーズに対する要求性能を満たすのに苦労しました。昨今のニューラルネットワーク(注)全盛の时代になって、本来やりたかったことが短期间で実现できるようになってきたという気がします。

(注)ニューラルネットワーク
人间の脳の神経细胞(ニューロン)から着想を得た机械学习モデル。适切な学习データさえあれば、多様な数理モデルを近似的に実装可能と言われており、パターン认识や时系列予测などの诸问题に多大なインパクトを与え続けている。

现在の取り组みは。

自社の各部门やグループ会社からのニーズに基づく依頼研究、および、将来を见据えたシーズ技术の开発と评価を目的とした発意研究をおこなっています。
现在の取り组みとして、大きく4つのテーマがあります。
まず一つ目は、ベテランの技を技能継承するための教育支援技术で、原子力部门からの依頼研究として、ベテランの発话内容、注视点、身体动作を统合的に解析する「暗黙知」のデジタル记録技术の开発をおこなっています。実务経験の少ない若年层への技术継承という课题に対し、「ベテランの技」を追体験する教育効果が期待されます。

瀬川さん

二つ目は、蘑菇短视频パワーグリッドの送変电部门からの依頼研究として、设备の异常検出技术の开発をおこなっています。一般に异常データの収集は困难な场合が多く、正常データのみから异常状态の判别を学习する「教师无し异常検出技术」の実用化に向けた検讨をおこなっています。
叁つ目は、业务の安全管理に寄与するテキストマイニング技术で、「ヒヤリハット」と呼ばれるヒューマンエラーに関する大量の事例を用い、各部门の业务や期间に固有のキーワードや発生倾向、因果関係などを分析する技术の开発をおこなっています。数十万件に及ぶビッグデータを今后の安全管理に役立てたいと考えています。
四つ目は、音声認識や自然言語処理の応用技術として、会議の音声録音データから話者を識別して自動書き起こしおこない、その発話内容の要約を自動生成する議事録作成の支援技術の開発をおこなっています。基本的なスタンスとして、公司情报を内部で処理できるローカルな解析手法の検討を進めています。

础滨技术への想いは。

昨今の生成础滨技术は、15世纪のグーテンベルクの活版印刷発明に匹敌するくらいのインパクトを社会に与えており、今后もその影响力を増していくと考えています。
まだまだ出力结果の误りやコントロール性など课题は多いですが、その学习能力や推论など潜在性能は惊くべきものがあり、今后の発展をフォローしていきたいと思います。

今后の目标について教えてください。

研究开発部门として、最先端の研究の技术的なキャッチアップに努めていくとともに、応用技术の开発に取り组み、蘑菇短视频グループをはじめ电力业界の「お役立ちの研究」に迈进していきたいと思います。
今后も、特に大规模言语モデルをはじめとする生成础滨技术は、ますます加速的な进化を遂げていくことが予想されています。ただ、その进化スピードは极めて早く、数年先程度ならば予测できるかもしれませんが、10年先はもう未知数。今后の社会実装の形态がどのようになっていくか目が离せないですね。

瀬川さん

技術報告(技术开発ニュース)

国际会议等発表

  • O.Segawa, K.Takeda and F.Itakura, “Continuous speech recognition without end-point detection”, Proc. of IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP2001), pp.245-248 (2001)
  • O.Segawa, J.Kawai and K.Sakauchi, “Automatic generation of link collections and their visualization”, Proc. of The 14th International World Wide Web Conference WWW2005, pp.942-943 (2005)
  • O.Segawa, “Web annotation sharing using P2P”, Proc. of The 15th International World Wide Web Conference WWW2006, pp. 851-852 (2006)
  • O.Segawa, T.Hayashi and K.Takeda, “Attention-based speech recognition using gaze information”, Proc. of IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU2019), pp.465-470 (2019)
  • T.Kobayashi and O.Segawa, “Estimation of degradation curves for substation equipment using text mining”, CIGRE SCIENCE & ENGINEERING N°31 December 2023, pp.133-143 (2023)

特许等

関连情报共有装置及び関连情报共有方法(特许第4891571号)

入力情报分析装置(特许第5162151号)

入力情报分析装置(特许第5171087号)

文章情报グループ判别支援装置(特许第5245062号)

音声信号処理装置(特许第5627109号)

入力情报分析装置(特许第5657338号)

架空设备判别装置および架空设备判别方法(特许第6661869号)

物体识别装置(特许第7345355号)

マルチモーダル音声认识装置およびマルチモーダル音声认识方法(特许第7414231号)

画像生成支援装置(特许第7497791号)

所属学会

情报処理学会

日本音响学会

人工知能学会

电気学会

この研究者へのお问い合わせはこちら

ページトップへ