CSJセミナー参加報告 北村・徳田研究室 中村和寛.

Slides:



Advertisements
Similar presentations
ウィキについて 1 1040431 1 1040431 植木貴宏 植木貴宏. ウィキとは? ウェブブラウザを利用して Web サーバ 上のハイパーテキスト文書を書き換え るシステムの一種。 ウェブブラウザを利用して Web サーバ 上のハイパーテキスト文書を書き換え るシステムの一種。 Wiki とは、ハワイ語で「速い」を意味.
Advertisements

言語情報を利用したテキストマイニ ング 奈良先端科学技術大学院大学 情報科学研究科 工藤 拓 山本 薫 坪井 裕太 松本 裕治.
データベースの基礎知識 ACEESS の基本操作. データベースの基礎知識 データベース  特定のテーマや目的に毎のデータの集合体 データベースソフトウェア  データベースを作成、管理するソフトウェアの総 称 Oracle(Oracle) IBM(DB2) Microsoft(SQL Server)
電子書籍の検索機能の改善 木下研究室 201002713 鴫原 善寿. 背景 スマートフォンなどの携帯端末の普及と ともに電子書籍に注目が浴びた。中でも amazon の kindle など電子書籍の専用端末も 現れた。 電子書籍はデータなので本棚もいらず、 持ち運びも容易になるなど様々な恩恵を もたらした。
日本人学習者による英語音声の 韻律に関する研究
自然言語処理:第3回 1.前回の確認 2.構文解析 3.格文法.
DB(データベース)のおはなし 作成者:小野正広 DBと言っても、  ドラゴンボール ではないですぞ! 3/1/2017.
城北エリア痙縮治療セミナー 2015年8月31日(月) 帝京大学本部棟2階会議室05(会場地図裏面) 杉田 之宏 先生
MS-Word ⇒ XML 2001/10 マウスをクリックしてください。(カーソルはどこにあっても結構です。)次ページが表示されます。
知識情報演習Ⅲ(後半第1回) 辻 慶太(水)
英語の母音の長さを測定する(2).
早稲田大学大学院理工学研究科 情報科学専攻修士2年 後藤滋樹研究室 坂本義裕
オンライン英単語・リスニング 学習ソフト 佐々木研究室 N02k1114 北隅 麻実.
情報爆発A01支援班 マイサーチエンジン開発環境支援グループ 中村聡史, 大島裕明, 田中克己, 喜連川優
広島感染制御薬剤師セミナー 基礎コース 『 グラム陰性菌感染症の臨床 』 日時 : 2015年 6月 27日(土) 14:00~17:30
テキストマイニング, データマイニングと 社会活動のトレース
背景について 国立天文台 天文情報センター.
1.自然言語処理システム 2.単語と形態素 3.文節と係り受け
國立高雄大學東亞語文學系 「日語習作Ⅰ」 第6堂
形態素解析および係り受け解析・主語を判別
テキストの類似度計算
『談話研究と日本語教育の有機的統合のための
HTTPプロトコルとJSP (1) データベース論 第3回.
Webを利用した授業支援システムの開発 北海道工業大学 電気電子工学科 H 渋谷 俊彦.
江尻省、中村卓司、山本衛 (京都大学生存圏研究所) 塩川和夫 (名古屋大学太陽地球環境研究所)
セルロース学会北海道・東北支部セミナーの案内
サイト運営者へむけて、CMS管理画面をつかって サイト運営していく方法を紹介します。
Googleツールを用いた新しいWebシステムの開発
TTS技術の概要 1. TTSとは 2. TTS技術の応用 3. TTSシステムの流れ 4. 基本概念 5. F0モデル 6. 韻律記号
日本語解析済みコーパス管理ツール 「茶器」
1月19日 辞書 自然言語処理における辞書の役割 機械辞書設計の要点 辞書の種類と用途.
第1回化学グランプリ チャレンジ 2018 申込は 月 日( ) 演題 「電子で考える分子の構造や性質」
2004年6月3日 第2分科会 国際競争力のある人材育成.
2004年度 情報システム構成論 第1回 オリエンテーション
大規模データによる未知語処理を統合した頑健な統計的仮名漢字変換
レッスン1 情報の収集と整理 から プレゼンへ (道具を使いこなす)
独習XML 第2章 XML文書の構成要素 2.1 XMLの文字と文字列 2.2 コメント
ChaIME: 大規模コーパスを 用いた統計的仮名漢字変換
広瀬啓吉 研究室 4.音声認識における適応手法の開発 1.劣条件下での複数音源分離 5.音声認識のための韻律的特徴の利用
実行時情報に基づく OSカーネルのコンフィグ最小化
大規模データによる未知語処理を統合したスケーラブルな仮名漢字変換
「すべての疲労は脳が原因だった! 安心・安全・快適な健康長寿とは?」
深層学習を用いた音声認識システム 工学部 電気電子工学科 白井研究室 T213069 林健吉.
『談話研究と日本語教育の有機的統合のための
諸連絡 USBメモリの販売について 日時:6月23日(月)授業開始前 商品:プリンストン社製32MBのUSBメモリ
類似度を用いた WWW のリンク構造の解析 谷 研究室    栗原 伸行.
音声認識・翻訳 Android アプリケーション制作
エコマップ班 総合政策学部2年 飯塚直 2005年1月13日 厳網林研究会
テキストマイニング, データマイニングと 社会活動のトレース
構音障害者を対象とした混合正規分布モデルに基づく統計的声質変換に関する研究
音声データにおける 墨塗り署名ツール“SANI”の開発
厚生労働省委託事業:EBM(根拠に基づく医療)普及推進事業
ブースティングとキーワードフィルタリング によるシステム要求検出
構造的類似性を持つ半構造化文書における頻度分析
発表32 レポート評価支援について (剽窃部分と指導箇所の検出)
セマンティックWebの 生産管理システムへの適用
コーパス コーパス(Corpus)はコンピュータの発達とともに、計算機可読なデータを容易に作成・収集することができるようになったことがその背景にある。現在ではコーパス言語学などの学問もある。
A-17 検索履歴のプライバシーを秘匿した ユーザクラスタリング
大規模コーパスに基づく同義語・多義語処理
コンピュータ概論B ー ソフトウェアを中心に ー #00 概要説明
自然言語処理2015 Natural Language Processing 2015
資料3-2 平成26年度 第3回技術委員会資料 次年度テーマの検討
第5回音声ドキュメント処理ワークショップ (2011/3/7)
Googleマップを活用した 生物調査データベースの構築
セマンティックWebの 生産管理システムへの適用
形態素解析と構文解析 金子邦彦.
自然言語処理2016 Natural Language Processing 2016
mi-8. 自然言語処理 人工知能を演習で学ぶシリーズ(8)
Normalized Web Distanceを用いた音声認識の誤り訂正法 301-4in
1.2 言語処理の諸観点 (1)言語処理の利用分野
Presentation transcript:

CSJセミナー参加報告 北村・徳田研究室 中村和寛

日時・場所 日時 : 7月10日(土)13:30~17:00 場所 : 国立国語研究所(東京都)

道のり 名古屋 新幹線(2駅) 東京 山手線(9駅) 巣鴨 都営三田線(3駅) 板橋本町

高島屋のエレベータにて安全に集合

新幹線、遅れる…

速さに感動する

昼食と夕食の風景

噂の山手線

今回一番の収穫 都築さんに研究のことや研究室のことをいろいろ聞けたこと

セミナーの構成 『日本語話し言葉コーパスの概要』 XML文書についての解説 検索の実例

日本語話し言葉コーパスとは モノローグを中心とした、多少とも自発性を有する音声のデータベース サイズが大きい 研究用付加情報が非常に豊富 CSJ全体 752万語,661時間 コア 50万語44時間

一つの講演に対して提供されるデータ(全講演) 話者&講演情報 成年代、性別、出生地、転居暦、学歴、etc 転記テキスト 基本形(漢字と仮名) 発音形(片仮名のみ) 形態論情報 短単位と長単位(手解析と自動解析) 節単位情報(手解析と自動解析) 音声ファイル 16kHz,16bit,MS-RIFF 印象評定情報(単独評価)

一つの講演に対してさらに提供される データ(コア) 印象評定情報(集合評価) 係り受け構造情報 音声ラベル 文節音 イントネーション 重要文 談話境界(40ファイルのみ)

XMLによるCSJ各情報の記述 階層構造を基本としてXMLにて研究用付加情報が記述されている XSLTにより検索、構造変換ができる

その他 開発期間 : 5年 価格 学生 : 25000円 教授 : 50000円 企業 : 250000円

以上です。