- 音声対話文における助詞落ち・倒置の分析と解析手法
山本 幹雄 小林 聡 中川 聖一,
情報処理学会論文誌, vol. 33, No. 11, pp.1322-1330, 1992年11月.
音声対話に現われる、助詞落ちと倒置の特徴を分析・検討した。
その結果に基づき、助詞落ちと倒置を含む文を受理可能な言語処
理システムを作成し、評価を行なった。(実験および結果の整理
の一部を担当).
- A Spoken Dialog System with Verification and Clarification
Queries
Mikio YAMAMOTO, Satoshi KOBAYASHI, Yuuji MORIYA, Seiichi NAKAGAWA,
IEICE. Trans. INF. & SYST., Vol. E76-D, No.1, pp.84-94, January 1993.
人間同士の対話に現われる、確認と明確化の質問の方法を分析・検
討した。その分析結果に基づき、ユーザーの入力に含まれる曖昧性を解消
するために積極的に質問を行なう対話システムを作成し、評価を行なった。
(実験および結果の整理の一部を担当).
[
論文(島根大学のサーバ)],
[
論文(skoba.org)]
- 自然な音声対話における間投詞・ポーズ・言い直しの出現パターン
と音響的性質
中川 聖一, 小林 聡, 日本音響学会誌, Vol. 51, No.3, pp.202-210,
1995年3月.
音声対話に特有の現象として、間投詞、ポーズ、
言い直しを対象とし、その出現位置や出現形態の特徴を分析・検討し
た。また、得られた特徴に基づいて、言い直し部分を自動的に推定す
るシステムを作成し、評価を行なった。(全般を担当).
[
論文(島根大学のサーバ)],
[
論文(skoba.org)]
- 日本語の自然対話音声におけるパラ言語的特徴の検討
小林 聡,北澤 茂良, 日本音響学会誌, vol. 56, No. 7, pp.467-476,
2000年 7月.
自然な対話を収録し、そこにパラ言語が含まれるか否かの判断
について分析・検討を行なった。特に声の高さ、大きさ、発話速度を
対象とし、それらの変化によりパラ言語が表現されていると感じられ
る箇所に複数の被験者がラベル付けを行なった。得られたラベルに基
づいて、被験者間での一致率、ラベル付けされた箇所での音響パラメー
タの特徴を分析・検討した。(全般を担当).
[
論文(島根大学のサーバ)],
[
論文(skoba.org)]
- 字幕付きテレビニュース放送を素材とした語学学習教材作成システム
小林 聡,田中 敬志,森 一将,中川 聖一, 人工知能学会論文誌, 17巻,
4号 SP-G, pp.500-509, 2002年.
字幕付きテレビニュース放送から、音声認識技術を応用し、リ
スニング用語学学習教材を自動作成するシステムについて、作成シス
テムおよび教材のプレイヤを構築した。また作成された教材について
のアンケート調査による評価を行なった。(指導の全般を担当).
[
論文(島根大学のサーバ)],
[
論文(skoba.org)]
- 講義再現システムにおけるスライド重要度抽出
山田 博文,松田 和彦,田口 亮,桂田 浩一,小林 聡,新田 恒雄, 人工
知能学会論文誌, 17巻 4号 SP-E, pp.481-489, 2002年.
- MMI記述言語XISLの提案
桂田 浩一,山田 博文,中村 有作,小林 聡,山田 真,新田 恒雄,
情報処理学会論文誌,vol. 44, No.11, pp.2681-2689, 2003年 11月.
マルチモーダルインタラクション(MMI)記述言語XISLを提案し
た。XISLの目標は、1)MMIで必要とされるモダリティの利用方法・対
話の制御を記述可能にすること、2)モダリティの拡張性を高めること
である。これらを実現するために、XISLでは、1)VoiceXML、SMILといっ
た従来言語を参考にモダリティの利用方法および対話制御の諸概念や
命令を導入し、2)入出力モダリティの関する記述に自由度を持たせて
いる。本論文ではXISLの概略を説明すると共に、PC上に実装したXISL
の実行システム、およびプロトタイプとして試作したオンラインショッ
ピングアプリケーションについて述べる。また、XISLを他の言語と比
較することにより、XISLのMMI記述言語としての特徴を明らかにする。
(指導の一部を担当).
[
論文(島根大学のサーバ)],
[
論文(skoba.org)]
- 字幕・副音声付きテレビニュース放送を利用可能な語学学習教材作成シ
ステムとリスニング教材プレイヤー
田中 敬志,小林 聡,中川 聖一, 日本教育工学会誌,vol. 27, no. 3,
pp.273-282, 2004年 3月.
字幕付きテレビニュース放送から、音声認識技術と自然言語処
理技術を応用し、リスニング用語学学習教材用データを自動作成する
システムを作成した。またそれによって得られる教材用データを用い
る教材プレイヤーを開発した。教材用データ及び教材プレイヤーを日
本人学生(英語教材)、留学生(日本語教材)に8週間試用してもらった。
この試用の前後のテストを行ない、また試用の後にアンケートを取っ
た。テストでは成績の明らかな向上が見られた。アンケートにおいて
も本教材(教材作成システム,教材用データ, 教材プレイヤー)ついて
肯定的な意見が得られた。(指導の一部を担当).
[
論文(島根大学のサーバ)],
[
論文(skoba.org)]
- 表層的言語情報と韻律情報を用いた講演音声の重要文抽出による要約
小林 聡, 山口 優,中川 聖一, 自然言語処理, vol. 12,
No. 6. pp.3-24, 2005年 11月.
音声情報は記録が容易であるが、記録後の参照は必ずしも容易
ではない。本論文では、音声の自動抽出要約を目指し、表層的言語情
報による重要文抽出結果と人間による結果との比較を行ない、音声の
抽出要約に有用と思われる表層情報を得た。また韻律情報として
F0とパワーに着目し、人間による結果との比較を行なった。最後に表
層的言語情報と韻律情報を組み合せた自動抽出要約システムを作成し、
そのシステムによって得られる抽出要約と人間による抽出要約との比
較、聴取実験を行なった。結果としてF値=0.599、κ値=0.420 と良好
な結果を得た。(指導の一部を担当).
[
論文(島根大学のサーバ)],
[
論文(skoba.org)]
- arχves: 公開鍵暗号を用いた研究記録管理・公開・検証システム構築の試み
加藤 未来, 小林 聡, 学術情報処理研究, no. 12,
pp.43-51, 2008年9月.
- 研究記録管理・公開・検証システムarχvesにおける確認者署名機能の実現
- 加藤 康, 島貫 稚華, 藤坂 達也, 小林 聡, 学術情報処理研究, no. 14,
pp.43-51, 2010年9月.
昨今,研究成果や論文の捏造の問題が社会問題となったことは記憶に新しい.
改竄が困難な方法によって研究記録が保存されているならば,指導者あるいは
上司による監督や,研究記録あるいは研究実態の検証に関して大いに助けにな
るであろう.この際,研究記録の正真性と非改竄性の保証をいかに行なうかが
課題となる.この問題に対し,我々は電子署名を用いた研究記録管理・公開・
検証システムar$\chi$vesを構築した.しかし,研究記録の証拠能力を高めるた
めには,記録者の署名のみではなく,確認者(証人)による署名も必要である.
そこで,我々はar$\chi$ves上に,同様に電子署名を用いた確認者署名機能を実
装した.本システムでは,記事などへの改竄の検証の強度を増すために,確認
者の秘密鍵は検印サーバに置き,署名の際には確認者は検印サーバを部分的に
プロキシ的に用いて文書サーバと通信し,処理を行なうよう実装した.
(全般の指導を担当)
島根大学学術情報リポジトリ,
島根大学のサーバ,
[skoba.org]
- Tempo Estimation by Wave Envelope for Recognition of
Paralinguistic Features in Sontaneous Speech
Hideya ICHIKAWA, Shigeyoshi KITAZAWA, Satoshi KOBAYASHI ,
Takao MATSUNAGA ,
Proceedings of International Conference on Spoken Language Processing,
S27-29, pp. 1691-1694, September 1994.
音声信号の振幅包絡線に対してFFT処理を行なうことで、発話
速度の自動測定を試み、手法の有用性を示した。(結果の整理の一部を担当)
- Consistency of Inter-Transcribers' Transcription
Satoshi KOBAYASHI, Shigeyoshi KITAZAWA,
Proceedings of Europian Conference on Speech Communication and
Technology, pp. 1263-1266, September, 1995.
テレビのインタビュー番組内での発話に対して、声の高さ、大
きさ、発話速度などの変化にラベル付けを行ない、そのラベル結果が
被験者間で安定している程度や、トレーニング回数によってどのよう
に変化するのかを分析・検討した。(全般を担当)
[
論文(島根大学のサーバ)],
[
論文(skoba.org)]
- TEMAX: Visualization of Temporal Variation in Spontaneous Speech
Shigeyoshi Kitazawa, Hideya Ichikawa, Satoshi Kobayashi,
Proceedings of Acoustical Society of America and Acoustical
Society of Japan Third Joint Meeting, pp.1229-1232, December 1996.
音声信号の振幅包絡線に対して FFT 処理によって発話速度の
自動測定を行ない、そこに確認される日本語のリズム構造について分
析・検討した。(実験の一部を担当)
- XISL: An Attempt to Separate Interactions from Data
Kouichi KATSURADA, Yusaku NAKAMURA, Satoshi KOBAYASHI, Tsuneo
NITTA, Proceedings of INTERACT '01, pp.763-764, 2001.
マルチモーダル対話を記述する際に、コンテンツとビュー、そ
してインタラクションの記述を分離することを目的とする、XISL言語
の提案を行なった。(全般の指導を担当)
- XISL: An Attempt to Separate Multimodal Interactions form XML
Contents
Tsuneo NITTA, Kouichi KATSURADA, Hirobumi Yamada,Yusaku
NAKAMURA, Satoshi KOBAYASHI, Proceedings of EUROSPEECH 2001,
pp.1197-1200, September 2001.
マルチモーダル対話を記述する際に、コンテンツとビュー、そ
してインタラクションの記述を分離することを目的とする、XISL言語
の提案を行なった。(全般の指導を担当)
- Automatic Construction of CALL System from TV news Program with
Captions
Takashi Tanaka, Kazumasa Mori, Satoshi Kobayshi, Seiichi
Nakagawa, Proceedings of EUROSPEECH 2001, pp.2815-2818,
September 2001.
字幕付きテレビニュース放送から、音声認識技術を応用し、リ
スニング用語学学習教材を作成することを目指し、教材作成システムおよ
び教材のプレイヤを構築し、基礎的研究を行なった。(全般の指導を
担当)
- An automatic construction system of CALL materials from TV
News program with captions
Takashi Tanaka, Kazumasa Mori, Satoshi Kobayshi, Seiichi Nakagawa,
Proceedings of InSTil 2002, pp.682-685, Marc 2002.
- Extracting Summarization of Lectures Based on Linguistic Surface
and Prosodic Information
Satoshi Kobayashi, Noriki Yoshikawa, Seiichi Nakagawa,
Proceedings of ISCA & IEEE workshop on Spontaneous Speech
Processing and Recognition, pp.211--214, April 2003.
講演音声から、言語的表層情報および韻律的情報を用いた、抽
出要約手法について述べた。聴取実験による結果として、人間による
抽出要約と同程度の聞き易さと良さを実現した。(全般の指導を担当)
[
論文(島根大学のサーバ)],
[
論文(skoba.org)]
- 対話における曖昧さを解消するための質問生成システム
山本 幹雄, 小林 聡, 中川 聖一, 人工知能学会全国大会,
pp.551-554, 1991年6月.
ユーザーの発話を確認・明確化するための質問を積極的に生成
するシステムを構築するために、人間同士の対話に現われる確認・明
確化の質問の内容を分析・検討した。また分析に基づき、システムを
構築した。(資料の分析の一部と、システム構築の一部を担当)}
- 対話における質問-応答対の入れ子構造の分析
山本 幹雄, 小林 聡, 中川 聖一, 電気情報通信学会秋期大会, D-51,
pp.6-55--6-56, 1991年 9月.
ユーザーの発話を確認・明確化するための質問を積極的に生成
するシステムの構築を目的に、人間同士の対話に現われる質問-応答
対の入れ子構造の分析・検討を行なった。(資料の分析を担当)}
- 音声対話におけるいくつかの統語的特徴
小林 聡, 山本 幹雄, 中川 聖一, 電気関係学会東海支部連合大会,
pp.556, 1991年11月.
話し言葉を受理可能な対話システムの構築のために、話し言葉
に現われる助詞脱落、倒置、疑問文の特徴を分析・検討した。(全般
を担当)
- 音声対話とキーボード対話における発話文の統語的特徴の比較
小林 聡, 山本 幹雄, 中川 聖一, 情報処理学会春期大会, 6N-3,
pp.2-149--2-150, 1992年3月.
話し言葉を受理可能な対話システムの構築のために、話し言葉
と書き言葉の差異を知るため、キーボードを使って行なわれた対話
(チャット) と音声対話について、助詞の脱落と係り受け距離に見ら
れる差異を分析・検討した。(全般を担当)
- 対話音声の発話速度の測定
市川 英哉, 小林 聡, 北澤 茂良, 日本音響学会秋季研究発表会,
1-P-22, pp.381-382, 1994年10月〜11月.
音声の包絡線の周波数分析・検討を行ない、その結果と発話速
度との相関を分析・検討した。(実験の一部を担当)
- 対話音声情報の書き起こし精度の定量的評価
小林 聡, 菅原 芳彦, 北澤 茂良, 日本音響学会秋季研究発表会,
1-Q-9, pp.159-160, 1994年10月〜11月.
対話音声の分析・検討は、その書き起こしに基づいて行なわれ
ることが多い。そこで、音韻および超分節的特徴の書き起こしを行な
い、複数の被験者間における書き置こしの一致の程度を分析・検討し、
書き起こしを資料として使うことの妥当性を分析・検討した。(全般
を担当)
- 対話音声の振幅に基づく発話速度の測定
北澤 茂良, 小林 聡, 市川 英哉, 日本音響学会秋季研究発表会,
2-P-13, pp.327-328, 1995年9月.
- 習熟および環境による対話音声情報の書き起こし精度の定量的評価
小林 聡, 北澤 茂良, 日本音響学会秋季研究発表会, 1-7-4,
pp.391-392, 1995年9月.
- 非言語情報の音響的特徴
小林 聡, 北澤 茂良, 日本音響学会春季研究発表会, 1-4-16,
pp.249-250, 1996年3月.
ラジオ番組のニュースおよびそれに続く自発的と思われる発話
を対象に、非言語的特徴のラベル付けを行ない、2名の被験者間での
ラベルの精度およびラベル付けされた箇所での音響的特徴を分析・検
討した。(全般を担当)
- 非言語情報の書き起こしと音響的変化との関連
小林 聡, 北澤 茂良, 日本音響学会秋季研究発表会, 1-P-5,
pp.291-292, 1996年9月.
ラジオ番組のニュースおよびそれに続く自発的と思われる発話
を対象に、非言語的特徴のラベル付けを行ない、複数の被験者間での
ラベルの精度およびラベル付けされた箇所での音響的特徴やラベルを
付けるか否かの弁別閾を分析・検討した。(全般を担当)
- 非言語情報を含む書き起こしテキストからの対話音声合成
杉村 元希, 小林 聡, 北澤 茂良, 日本音響学会秋季研究発表会,
1-4-9, pp.207-208, 1996年9月.
非言語情報および超分節的特徴を記述したテキストから合成音
声を作成し、非言語情報が合成音声の自然性に与える影響を分析・検
討した。(実験の一部を担当)
- 非言語的特徴の識別に関する諸要因
小林 聡, 北澤 茂良, 日本音響学会秋季研究発表会, 1-Q-16,
pp.329-330, 1997年3月.
ラジオ番組のニュースおよびそれに続く自発的と思われる発話
を対象に、5名の被験者が非言語的特徴のラベル付けを行なった。ラ
ベル結果に基づき、被験者のラベル結果と良く適合する音響的特徴の
評価方法を決定した。その評価方法により、ラベル結果と音響的特徴
の関連を分析・検討した。(全般を担当)
[
論文(島根大学のサーバ)],
[
論文(skoba.org)]
- 書き起こしテキストの非言語情報についての音調調節による検証
杉村 元希, 小林 聡, 北澤 茂良, 日本音響学会秋季研究発表会,
1-Q-17, pp.331-332, 1997年3月.
- 自然な対話における非言語情報情報の書き起こしと物理関連量
小林 聡, 北澤 茂良, 日本音響学会秋季研究発表会, 1-3-14,
pp.393-394, 1997年9月.
雑談から抜き出した音声を対象に、複数の被験者が非言語的特
徴のラベル付けを行なった。ラベル結果に基づき、被験者のラベル結
果と良く適合する音響的特徴の評価方法を決定した。その評価方法に
より、ラベル結果と音響的特徴の関連を分析・検討した。(全般を担
当)
[
論文(島根大学のサーバ)],
[
論文(skoba.org)]
- 音韻内容を除いた音声における非言語情報の識別
小林 聡, 北澤 茂良, 日本音響学会春季研究発表会, 1-8-18,
pp.375-376, 1998年3月.
非言語情報が含まれるか否かの判断に対して、音韻内容(およ
びそこから得られる意味)が与える影響を分析・検討するため、音韻
内容を含んだ音声と、音韻内容を除いた再合成音声を対象に非言語情
報のラベル付けを行なった。ラベル結果から、複数の被験者間での一
致率、対象とした音声でのラベルの差異、およびラベル付けされた箇
所での音響的特徴を分析・検討した。(全般を担当)
- HMMによる子音認識結果から導かれる日本人の英語発音の特徴
北澤 茂良, 北村 達也, 小林 聡, 北川 和弘, 日本音響学会秋季研究
発表会, 1-R-18, pp.153-154, 1998年9月.
HMMに基づく音声認識システムを用いて日本人の英語発話を認
識し、その認識結果に基づいて日本人の英語発話に見られる特徴およ
びHMMの音韻モデルに見られる問題点を分析・検討した。(実験の一部
を担当)
- 音声振幅包絡線の周期性に基づく発話速度の測定
内沢 忠男, 小林 聡, 北澤 茂良, 日本音響学会秋季研究発表会,
1-2-11, pp.195-196, 1998年9月.
音声波形の振幅包絡線のFFT分析・検討によって発話速度や発
話リズムを可視化するTEMAX法の問題点として、TEMAXグラムの読み難
さが有る。そこで、TEMAX法を補助する方法として、音声波形の振幅
包絡線を(暫定的に) フォルマント分析・検討することによって発話
速度を自動推定するSEPAX法を提案し、音韻ラベルから計測する発話
速度やTEMAX法の結果との比較を行なった。(SEPAX法の測定方法の提
案と、実験の一部を担当)
- 周辺言語的特徴と韻律的特徴との比較
小林 聡, 北澤 茂良, 日本音響学会秋季研究発表会, 1-2-15,
pp.203-204, 1998年9月.
周辺言語と韻律を、その定義や現象に基づいて比較し、その比
較から得られた仮説に基づいて複数の被験者が周辺言語のラベル付け
を行なった。そのラベル結果に基づき、被験者間でのラベルの一致や
ラベル付けされた箇所での音響的特徴の分析・検討を行なった。(全
般を担当)
- TEMAX による中国南部および北部出身者の日本語学習の分布
北澤 茂良, 姜 軍, 小林 聡, 北村 達也, 日本音響学会秋季研究発表
会, 1-2-26, pp.225-226, 1998年9月.
中国語を母語とする者の日本語発話に見られる発話リズムの分
析・検討をTEMAX法を用いて行なった。(実験の一部を担当)
- 字幕付きテレビニュース放送の語学学習教材化
小林 聡, 田中 敬志, 森 一将, 中川 聖一, 教育工学関連学協会連合
第6回全国大会予稿集, K3B22n4, pp.491-494, 2000年 10月.
- マルチモーダルインタフェースにおける応答戦略の検討
大谷 佳彦,鈴木 浩和,小林 聡, 桂田 浩一, 新田 恒雄, 情報処理学
会春期大会, 1U-5, Vol. 4, pp89-90, 2001年 3月
マルチモーダルインタフェースを備えた教育支援システムを作
成し、その応答戦略を検討した。(一部の指導を担当)
- XISL: コンテンツ記述とインタラクション記述分離の試み
中村 有作, 小林 聡, 桂田 浩一, 新田 恒雄, 情報処理学会春期大会,
7Q-1, Vol. 4, pp71-72, 2001年 3月
XMLコンテンツと、それに対するインタラクション記述を分離
し、閲覧機器に適したインタラクションを記述する方法の概要を報告
した。(全般の指導を担当)
- 字幕つきテレビニュース映像を利用した語学学習教材の自動作成
森 一将, 田中 敬志, 小林 聡, 中川 聖一, 電子情報通信学会, 情報・
システムソサイエティ大会予稿集, SD-2-2, pp. 299-300 ,
2001年 9月
字幕付きテレビニュース放送を利用した,語学学習教材作成シ
ステムおよび教材プレイヤーについて報告した。(指導の一部を担当)
- 韻律情報と表層情報を用いた講演音声からの重要文自動抽出の試み
小林 聡, 中川 聖一: 日本音響学会春季研究発表会, 3-10-17,
pp.335-336, 2002年 3月.
- 講演の聞き取りと書き起こしテキストからの重要文抽出
片岡 嘉孝, 吉川裕規,小林 聡, 中川 聖一: 日本音響学会秋季研究発
表会, 3-Q-23, pp.199-200, 2002年 9月.
- 日本人英語音声とネイティブ英語音声の強勢等時性の自動評価法
中島 丈晴, 小林 聡, 中川 聖一: 日本音響学会春季研究発表会,
3-6-15, pp.357-359, 2003年 3月.
- 表層的言語情報と韻律情報を用いた講演音声の要約と評価
吉川 裕規, 小林 聡, 中川 聖一: 日本音響学会春季研究発表会,
3-Q-35, pp.221-222, 2003年 3月.
- 字幕付きテレビニュース放送を題材としたCALLシステムにおける副音声
の利用
田中 敬志, 小林 聡, 中川 聖一: 情報処理学会第65会全国大会,
3T6-5,, pp.5-399--5-342, 2003年 3月.
筆者らは以前より字幕付きテレビニュース放送からの語学学習
教材の作成およびその教材の利用について研究しているが、今回テレ
ビニュース放送の副音声の利用を検討した。結果、良い精度で主音声
(字幕)との同期が取れた。(指導の一部を担当)
[
論文(島根大学のサーバ)],
[
論文(skoba.org)]
- パラ言語情報の認知における基本周波数の変化の影響
宮城 加奈, 小林 聡: 音響学会講演論文集, 2-3-10, pp. 413--414,
2006年 3月.
2モーラ語「ええ」の1モーラ目と2モーラ目の基本周波数を変
えることにより、どのようなパラ言語情報が受け取られるかについて
研究を行なった。この際、44名の被験者が、19セットの音声の各々に
対して24 個の印象語の強さを5段階評価した。結果として24個の印象
語は数個のグループに分けられた。(全般の指導を担当)
[
島根大学のサーバ],
[
skoba.org]
- 「ええ」に対するパラ言語の認知におけるF0の影響
高見 和之, 小林 聡: 音響学会講演論文集, 2-P-28, pp. 601--602,
2008年 3月.
2モーラ語「ええ」の1モーラ目と2モーラ目のF0
を独立に変化させることにより、どのようなパラ言語情報が受け取られるかに
ついて研究を行なった。この際、25名の被験者の各々が、75セット中45セット
の音声の各々に対して24個の印象語の強さを5段階評価した。結果として24個
の印象語は数個のグループに分けられた。前項との違いは、前項ではF0の変化
率のみに注目したが、本研究ではF0の値そのものにも目を向けている点である。
(全般の指導を担当)
[
島根大学のサーバ],
[
予稿(skoba.org)]
- 母音2モーラ語に対するパラ言語情報の認識におけるF0の影響
藤原 路浩, 小林 聡: 音響学会講演論文集, 2-P-14, pp. 477--480,
2009年 3月.
2モーラ語「ああ」の1モーラ目と2モーラ目
のF0を独立に変化させることにより、どのようなパラ言語情報が受け取ら
れるかについて研究を行なった。また、昨年の高見による「ええ」に対す
る結果と比較し、語彙の違いにより受け取られるパラ言語情報の印象や程
度に違いがあることを確認した。
(全般の指導を担当)
[
島根大学のサーバ],
[
skoba.org]
- 2モーラ語/ee/におけるパラ言語情報の認知に対するF0およびモーラ継続長の影響
竹川 弘一, 小林 聡: 日本音響学会講演論文集, 1-P-32, pp. 483--486,
2010年 3月.
2モーラ語「ええ」の第1モーラと第2モーラのF0および継続長を独立
に変化させることにより、どのようなパラ言語情報が受け取られるかにつ
いて調査・分析を行なった。
(全般の指導を担当)
[
島根大学のサーバ],
[
skoba.org]
- 声の高さ・長さ・大きさのパラ言語情報の認知に与える影響
竹谷 雄太, 小林 聡: 日本音響学会講演論文集, 2-P-39, pp. 451--454,
2011年 3月.
2モーラ語「ええ」の第1モーラと第2モーラのF0お
よび継続長を独立に変化させるとともに、語の大きさの違いにより、
どのようなパラ言語情報が受け取られるかについて調査・分析を行なっ
た。(全般の指導を担当)
[
島根大学のサーバ],
[
skoba.org]
- 確認と明白化の質問機能を持つ音声対話システム
山本 幹雄, 田口 勝豊, 小林 聡, 森屋 裕治,来住 浩樹, 甲斐 充彦,
中川 聖一, 情報処理学会「音声言語情報処理と音声入出力装置」研
究グループ, pp.27-36, 1992年7月.
人間同士の対話に見られる、曖昧さを解消するための確認・明
白化の質問を分析・検討した。その分析に基づき、積極的に質問を行
なう音声対話システムを作成し、音声対話システムにおける確認・明
白化の対話について検討した。(資料の分析およびまとめを担当)
- 間投詞の出現位置の特徴分析と音声認識システムの評価
小林 聡, 甲斐 充彦, 山本 幹雄, 中川 聖一, 情報処理学会「音声言
語情報処理と音声入出力装置」研究グループ, pp.21-25, 1993年 2
月.
人間同士の行なう対話に現われる間投詞の出現位置の特徴を分
析・検討した。その結果に基づき、間投詞を含んだ発話も受理可能な
音声認識システムを構築し、評価した。(間投詞の分析および全体の
まとめを担当)
[
論文(島根大学のサーバ)],
[
論文(skoba.org)]
- 間投詞,言い直し等の出現に関する音響的特徴
小林 聡, 山本 幹雄, 中川 聖一, 情報処理学会「音声言語情報処理
と音声入出力装置」研究グループ, pp.7-10, 1993年7月.
- 習熟による対話音声情報の書き起こし精度の定量的評価
小林 聡, 北澤 茂良, 情報処理学会「音声言語情報処理」研究会,
pp.61-66, 1995年7月.
- 非言語的特徴の書き起こしと物理関連量
小林 聡, 北澤 茂良, 電子情報通信学会,信学技法, SP96-51,
pp15-21,1996年9月.
音声における非言語的特徴としてパラ言語を対象に、複数の被
験者がラベル付けを行なった。得られたラベル結果から被験者間での
一致の程度や、ラベルが付けられた位置での音響パラメータの特徴を
分析・検討した。(全般を担当)
- TEMAXによる発話リズムの抽出について
北澤 茂良, 杉浦 久夫, 下岡 大祐, 小林 聡, 電子情報通信学会,信
学技法, SP96-68, pp51-58,1996年11月.
音声の包絡線の周波数分析・検討によって得られるTEMAXグラ
ムが発話速度や発話リズムを表現していると考え、日本語および英語
の発話リズムをTEMAXグラムを用いて分析・検討した。(実験の一部を
担当)
- 音声の高さ、大きさ、速さ感覚と物理関連量
小林 聡, 北澤 茂良, 電子情報通信学会,信学技法, SP96-69, pp1-8,
1996年12月.
パラ言語的特徴として声の高さ、大きさ、速さについて複数の
被験者がラベル付けを行ない、被験者間におけるラベルの一致および
ラベルが付けられた位置での音響パラメータの特徴を分析・検討した。
その際、特に音響パラメータを計測する窓幅としてラベルともっとも
良く適応するものを求め、使用した。(全般を担当)
- 自然な対話における非言語的特徴の識別に関する諸要因
小林 聡, 北澤 茂良, 電子情報通信学会,信学技法, SP98-1, pp1-8,
1998年 4月.
自由に行なわれた対話を収録し、そこに見られるパラ言語の分
析・検討を行なった。特に声の高さ、大きさ、発話速度を対象にラベ
ル付けを行ない、被験者間での一致率、ラベルが付けられた位置での
音響パラメータの特徴を分析・検討した。(全般を担当)
- 韻律的特徴と周辺言語的特徴
小林 聡, 北澤 茂良, 情報処理学会,音声言語情報処理研究会,
98-SLP-22-9, pp. 43-48, 1998年 7月.
音声に含まれる超分節的特徴である韻律とパラ言語(周辺言語)
の比較を行ない、パラ言語の位置付けを行なった。それと共に、自由
な対話に見られるパラ言語に複数の被験者がラベル付けを行ない、そ
のラベルの一致率、ラベルが付けられた位置での音響パラメータの特
徴を分析・検討した。(全般を担当)
- 字幕付きテレビニュース放送からの語学学習教材の自動作成
小林 聡, 田中 敬志,森 一将,中川 聖一, 電子情報通信学会,音声研
究会, SP2000-126, pp. 33-40, 2001年 1月.
字幕付きテレビニュース放送から、音声認識技術を応用し、リ
スニング用語学学習教材を作成することについて、作成システムおよ
び教材のプレイヤを構築し、基礎的研究を行なった。(全般の指導を
担当)
- マルチモーダル対話記述言語XISLの提案
小林 聡, 中村 有作, 桂田 浩一, 山田 博文, 新田 恒雄, 情報処理
学会, 音声言語情報処理研究会, 01-SLP-37, pp. 43-48, 2001年 7月.
マルチモーダルな対話を行なうためのシステム動作を記述する、
マルチモーダル対話記述言語 XISL を提案すると共に、試験システム
における実装について述べた。(全般の指導を担当)
- 音声対話記述言語 VoiceXMLとMMI記述言語XISLの比較
桂田 浩一, 中村 有作, 山田 真, 小林 聡, 山田 博文, 新田 恒雄,
情報処理学会, 音声言語情報処理研究会, 01-SLP-38, pp. 49-54,
2001年 10 月.
音声対話記述言語 VoiceXMLとMMI記述言語XISLの比較を行ない、
マルチモーダル対話記述におけるXISLの優位性を述べた。(指導の一
部を担当)
- MMI記述言語XISLによるオンラインショッピングシステムの開発
小林 剛典,中村 有作,桂田 浩一,山田 博文, 小林 聡, 新田 恒雄,
情報処理学会, 音声言語情報処理研究会, 02-SLP-42, pp. 11-16,
2002年 7月.
- 表層情報と韻律情報を利用した講演音声の要約
小林 聡,吉川 裕規,中川 聖一, 情報処理学会, 音声言語情報処理研
究会, 02-SLP-43, pp. 41-46, 2002年 10月.
- テレビニュース放送を利用した語学学習システムの評価
田中 敬志, 小林 聡,,中川 聖一, 電子情報通信学会, 信学技報
SP2002-162, pp. 7 --12, 2003年 1月.
- 場・時・人に着目した物語のシーン分割手法
小林 聡,
情報処理学会 自然言語処理研究会 研究報告 2007-NL-179,
pp. 25--30, 2007年 5月.
構造主義における物語の構造分析において得られた
知見を工学的に
利用・応用するための端緒として、物語テキストに表われる場所、時
間、登場人物についての表現に着目し、物語テキストのシーン分割を
試みた。結果、調査用データではF尺度で54、評価用データでは同じ
く56という結果を得た。(全体を担当)
[
島根大学リポジトリ],
[
島根大学のサーバ],
[
skoba.org]
- 2モーラ語「ええ」に対するパラ言語情報の認知におけるF0の影響
高見 和之, 小林 聡,
電子情報通信学会技術研究報告 〔音声〕, vol. 108, no. 116 (SP2008--20〜42),
pp. 121--126, 2008年 6月.
F0の高さおよび変化により、聞き手がどのようなパラ言語情報を受け
取るかについて、多義的な2モーラ語「ええ」を対象として、各モー
ラのF0を変えた合声音声を75種類作成し、その聴取実験を行なった。
聴取実験では、各被験者は45種類の音声を聴取し、それぞれの聴取に
おいて24 個の印象語の各々について得点を付けた。その結果に基づ
き、F0の高さや変化により、どのようなパラ言語情報が受け取られる
かについて検討した。定性的分析による分類において、F0の高さおよ
び変化に基づき、印象語を6つのグループに分類した。また、クラス
ター分析による定量的分析による分類においても、概ね同様のクラス
ター群を得た。(指導の全体を担当)}
[
島根大学リポジトリ],
[
島根大学のサーバ],
[
予稿(島根大学のサーバ)],
[
発表資料(島根大学のサーバ)],
[
skoba.org]