Edge, Chrome, Safari, Firefox推奨
UniDicのロゴ コーパス開発センターのロゴ
現代書き言葉UniDic unidic_bccwj

ファイルサイズが2.2Gと非常に大きいので、ダウンロードの際は注意してください。

現代の書き言葉テキストを短単位自動解析するための解析用辞書です。 以下のようなテキストの解析に使用できます。

書籍、 雑誌、 新聞、 白書、 検定教科書、 広報紙、 Web掲示板、 ブログ、 韻文、 法律文書、 国会会議録 など

この解析用辞書を利用して行なった研究等の成果を公表する場合は、その旨を明記してください。 必要に応じて参考文献に挙げた文献を参照してください。

ライセンス
GPL/LGPL/BSD License

unidic_bccwj_download_button

旧バージョンはこちら

web_chamame

参考文献
  • 岡 照晃: 「CRF素性テンプレートの見直しによるモデルサイズを軽量化した解析用UniDic ― unidic-cwj-2.2.0 と unidic-csj-2.2.0 ― 」, 言語資源活用ワークショップ2017発表予稿集, pp.143-152 (2017).
  • 伝 康晴, 小木曽 智信, 小椋 秀樹, 山田 篤, 峯松 信明, 内元 清貴, 小磯 花絵: 「コーパス日本語学のための言語資源:形態素解析用電子化辞書の開発とその応用」, 日本語科学, Vol.22, pp.101-123 (2007). [can not read online]
  • 伝 康晴. 多様な目的に適した形態素解析システム用電子化辞書, 人工知能学会誌, Vol.24, No.5, pp.640-646 (2009).
References
  • Yasuharu Den, Toshinobu Ogiso, Hideki Ogura, Atsushi Yamada, Nobuaki Menematsu, Kiyotaka Uchimoto and Hanae Koiso. The development of an electronic dictionary for morphological analysis and its application to Japanese corpus linguistics, Japanese Linguistics, Vol.22, pp.101-123 (2007). [in Japanese][can not read online]
  • Yasuharu Den. A Multi-Purpose Electronic Dictionary for Morphological Analyzers, Journal of Japanese Society for Artificial Intelligence, Vol.24, No.5, pp.640-646 (2009). [in Japanese]
  • Kikuo Maekawa, Makoto Yamazaki, Takehiko Maruyama, Masaya Yamaguchi, Hideki Ogura, Wakako Kashino, Toshinobu Ogiso, Hanae Koiso and Yasuharu Den. Design, Compilation, and Preliminary Analyses of Balanced Corpus of Contemporary Written Japanese, In Proceedings of the Seventh International Conference on Language Resources and Evaluation (LREC 2010), pp.1483-1486 (2010).
現代話し言葉UniDic unidic_csj

ファイルサイズが2.2Gと非常に大きいので、ダウンロードの際は注意してください。

現代話し言葉の転記テキストを短単位自動解析するための解析用辞書です。 学習には『日本語話し言葉コーパス(CSJ)』と 『日本語日常会話コーパス(CEJC)』を利用しているので、 それぞれの転記基準に即したテキストの解析に使用できます。

CSJとCEJCの転記基準は以下の文献で確認できます。

CSJの転記基準

  • 小磯花絵・西川賢哉・間淵洋子: 転記テキスト, 日本語話し言葉コーパスの構築法 第2章, pp.23-132 (2006).

CEJCの転記基準

  • 臼田泰如, 川端良子, 西川賢哉, 徳永弘子, 小磯花絵: 『日本語日常会話コーパス』の転記基準について, 言語処理学会第23回年次大会発表論文集, pp.174-177 (2017).
  • 川端良子, 川端 良子, 臼田 泰如, 西川 賢哉, 徳永 弘子, 小 磯 花絵: 「日常会話コーパス」の転記基準と作業工程, 言語資源活用ワークショップ2016予稿集, pp.296-306 (2017).

CRFのモデルのコストが異なるだけで、辞書の語彙は現代書き言葉UniDicと同一です。

この解析用辞書を利用して行なった研究等の成果を公表する場合は、その旨を明記してください。 必要に応じて参考文献に挙げた文献を参照してください。

ライセンス
GPL/LGPL/BSD License

unidic_csj_download_button

旧バージョンはこちら

web_chamame

参考文献
  • 岡 照晃: 「CRF素性テンプレートの見直しによるモデルサイズを軽量化した解析用UniDic ― unidic-cwj-2.2.0 と unidic-csj-2.2.0 ― 」, 言語資源活用ワークショップ2017発表予稿集, pp.143-152 (2017).
  • 伝 康晴, 小木曽智信, 小椋 秀樹, 山田 篤, 峯松 信明, 内元 清貴, 小磯 花絵: 「コーパス日本語学のための言語資源:形態素解析用電子化辞書の開発とその応用」, 日本語科学, Vol.22, pp.101-123 (2007).
References
  • Yasuharu Den, Toshinobu Ogiso, Hideki Ogura, Atsushi Yamada, Nobuaki Menematsu, Kiyotaka Uchimoto and Hanae Koiso. The development of an electronic dictionary for morphological analysis and its application to Japanese corpus linguistics, Japanese Linguistics, Vol.22, pp.101-123 (2007).
  • Yasuharu Den. A Multi-Purpose Electronic Dictionary for Morphological Analyzers, Journal of Japanese Society for Artificial Intelligence, Vol.24, No.5, pp.640-646 (2009). [in Japanese]
  • Kikuo Maekawa, Makoto Yamazaki, Takehiko Maruyama, Masaya Yamaguchi, Hideki Ogura, Wakako Kashino, Toshinobu Ogiso, Hanae Koiso and Yasuharu Den. Design, Compilation, and Preliminary Analyses of Balanced Corpus of Contemporary Written Japanese, In Proceedings of the Seventh International Conference on Language Resources and Evaluation (LREC 2010), pp.1483-1486 (2010).
古文用UniDicS unidic_chj
  1. 旧仮名口語UniDic
  2. 近代文語UniDic
  3. 近世口語(洒落本)UniDic
  4. 中世口語(狂言)UniDic
  5. 中世文語(説話・随筆)UniDic
  6. 中古和文UniDic
  7. 上代(万葉集)UniDic
旧仮名口語UniDic unidic_chj

旧仮名口語で書かれたテキストを短単位自動解析するための解析用辞書です。 主として旧仮名口語で書かれた雑誌記事の解析に使用できます。

営利を目的として利用する場合には、下記問合せ先まで事前にご相談ください。

この解析用辞書を利用して行なった研究等の成果を公表する場合は、その旨を明記してください。 必要に応じて参考文献に挙げた文献を参照してください。

ライセンス
クリエイティブ・コモンズ・ライセンス

unidic_chj_download_button

旧バージョンはこちら

web_chamame

参考文献
  • 小木曽智信: 「旧仮名遣いの口語文を対象とした形態素解析辞書」, じんもんこん2012論文集, pp.25-32 (2012).
References
  • Toshinobu Ogiso, Mamoru Komachi and Yuji Matsumoto. Morphological Analysis of Historical Japanese Text, Journal of Natural Language Processing, Vol.20, No.5, pp.727-748 (2013). [in Japanese]
  • Tomoaki Kouno and Toshinobu Ogiso. Improving an Electronic Dictionary for Morphological Analysis of Japanese: Use of historical period information, In Proceedings of The 9th International Conference of ASIALEX (ASIALEX2015) (2015). [can not read online]
近代文語UniDic unidic_chj

近代文語論説文を短単位自動解析するための解析用辞書です。 明六雑誌, 太陽, 国民之友のような近代の雑誌などの解析に使用できます。

営利を目的として利用する場合には、下記問合せ先まで事前にご相談ください。

この解析用辞書を利用して行なった研究等の成果を公表する場合は、その旨を明記してください。 必要に応じて参考文献に挙げた文献を参照してください。

ライセンス
クリエイティブ・コモンズ・ライセンス

unidic_chj_download_button

旧バージョンはこちら

web_chamame

参考文献
  • 小木曽 智信, 小町 守, 松本 裕治: 「歴史的日本語資料を対象とした形態素解析」, 自然言語処理, Vol.20, No.5, pp.727-748 (2013).
References
  • Toshinobu Ogiso, Mamoru Komachi and Yuji Matsumoto. Morphological Analysis of Historical Japanese Text, Journal of Natural Language Processing, Vol.20, No.5, pp.727-748 (2013). [in Japanese]
  • Tomoaki Kouno and Toshinobu Ogiso. Improving an Electronic Dictionary for Morphological Analysis of Japanese: Use of historical period information, In Proceedings of The 9th International Conference of ASIALEX (ASIALEX2015) (2015). [can not read online]
近世口語(洒落本)UniDic unidic_chj

近世の口語資料を短単位自動解析するための解析用辞書です。 主とし、洒落本や人情本テキストの解析に使用できます。

営利を目的として利用する場合には、下記問合せ先まで事前にご相談ください。

この解析用辞書を利用して行なった研究等の成果を公表する場合は、その旨を明記してください。 必要に応じて参考文献に挙げた文献を参照してください。

ライセンス
クリエイティブ・コモンズ・ライセンス

unidic_chj_download_button

旧バージョンはこちら

web_chamame

参考文献
  • 小木曽 智信, 市村 太郎, 鴻野知暁: 「近世口語資料の形態素解析の試み」, 第4回コーパス日本語学ワークショップ予稿集, pp.145-150 (2013).
References
  • Toshinobu Ogiso, Mamoru Komachi and Yuji Matsumoto. Morphological Analysis of Historical Japanese Text, Journal of Natural Language Processing, Vol.20, No.5, pp.727-748 (2013). [in Japanese]
  • Tomoaki Kouno and Toshinobu Ogiso. Improving an Electronic Dictionary for Morphological Analysis of Japanese: Use of historical period information, In Proceedings of The 9th International Conference of ASIALEX (ASIALEX2015) (2015). [can not read online]
中世口語(狂言)UniDic unidic_chj

中世の口語資料、主として狂言台本を短単位自動解析するための解析用辞書です。 虎明本狂言集のようなテキストの解析に使用できます。

営利を目的として利用する場合には、下記問合せ先まで事前にご相談ください。

この解析用辞書を利用して行なった研究等の成果を公表する場合は、その旨を明記してください。 必要に応じて参考文献に挙げた文献を参照してください。

ライセンス
クリエイティブ・コモンズ・ライセンス

unidic_chj_download_button

旧バージョンはこちら

web_chamame

参考文献
  • 小木曽 智信, 鴻野 知暁, 市村 太郎: 「狂言台本の形態素解析」, 日本語学会2015年度春季大会 (2015).
References
  • Toshinobu Ogiso, Mamoru Komachi and Yuji Matsumoto. Morphological Analysis of Historical Japanese Text, Journal of Natural Language Processing, Vol.20, No.5, pp.727-748 (2013). [in Japanese]
  • Tomoaki Kouno and Toshinobu Ogiso. Improving an Electronic Dictionary for Morphological Analysis of Japanese: Use of historical period information, In Proceedings of The 9th International Conference of ASIALEX (ASIALEX2015) (2015). [can not read online]
中世文語(説話・随筆)UniDic unidic_chj

中世文語(説話・随筆)を短単位自動解析するための解析用辞書です。 以下のようなテキストの解析に使用できます。

今昔物語集(本朝部), 宇治拾遺物語, 十訓抄, 方丈記, 徒然草 など

営利を目的として利用する場合には、下記問合せ先まで事前にご相談ください。

この解析用辞書を利用して行なった研究等の成果を公表する場合は、その旨を明記してください。 必要に応じて参考文献に挙げた文献を参照してください。

ライセンス
クリエイティブ・コモンズ・ライセンス

unidic_chj_download_button

旧バージョンはこちら

web_chamame

参考文献
  • 小木曽 智信, 小町 守, 松本 裕治: 「歴史的日本語資料を対象とした形態素解析」, 自然言語処理, Vol.20, No.5, pp.727-748 (2013).
References
  • Toshinobu Ogiso, Mamoru Komachi and Yuji Matsumoto. Morphological Analysis of Historical Japanese Text, Journal of Natural Language Processing, Vol.20, No.5, pp.727-748 (2013). [in Japanese]
  • Tomoaki Kouno and Toshinobu Ogiso. Improving an Electronic Dictionary for Morphological Analysis of Japanese: Use of historical period information, In Proceedings of The 9th International Conference of ASIALEX (ASIALEX2015) (2015). [can not read online]
中古和文UniDic unidic_chj

中古和文を短単位自動解析するための解析用辞書です。 以下のようなテキストの解析に使用できます。

古今和歌集, 土佐日記, 竹取物語, 伊勢物語, 落窪物語, 大和物語, 枕草子, 源氏物語, 紫式部日記, 和泉式部日記, 平中物語, 堤中納言物語, 更級日記, 讃岐典侍日記, 蜻蛉日記, 大鏡 など

営利を目的として利用する場合には、下記問合せ先まで事前にご相談ください。

この解析用辞書を利用して行なった研究等の成果を公表する場合は、その旨を明記してください。 必要に応じて参考文献に挙げた文献を参照してください。

ライセンス
クリエイティブ・コモンズ・ライセンス

unidic_chj_download_button

旧バージョンはこちら

web_chamame

参考文献
  • 小木曽 智信, 小椋 秀樹, 田中 牧郎, 近藤 明日子, 伝 康晴: 「中古和文を対象とした形態素解析辞書の開発」, 情報処理学会研究報告 人文科学とコンピュータ, Vol.2010-CH-85, No.4, pp.1-8 (2010).
  • 小木曽智信: 「中古仮名文学作品の形態素解析」, 日本語の研究, Vol.9, No.4, pp.49-6 (2013).
  • 小木曽 智信, 小町 守, 松本 裕治: 「歴史的日本語資料を対象とした形態素解析」, 自然言語処理, Vol.20, No.5, pp.727-748 (2013).
References
  • Toshinobu Ogiso, Mamoru Komachi, Yasuharu Den and Yuji Matsumoto. UniDic for Early Middle Japanese: a Dictionary for Morphological Analysis of Classical Japanese, In Proceedings of the 8th International Conference on Language Resources and Evaluation (LREC 2012), pp.911-915 (2012).
上代(万葉集)UniDic unidic_chj

万葉集を短単位自動解析するための解析用辞書です。

営利を目的として利用する場合には、下記問合せ先まで事前にご相談ください。

この解析用辞書を利用して行なった研究等の成果を公表する場合は、その旨を明記してください。 必要に応じて参考文献に挙げた文献を参照してください。

ライセンス
クリエイティブ・コモンズ・ライセンス

unidic_chj_download_button

旧バージョンはこちら

web_chamame

参考文献
  • 小木曽 智信, 小町 守, 松本 裕治: 「歴史的日本語資料を対象とした形態素解析」, 自然言語処理, Vol.20, No.5, pp.727-748 (2013).
References
  • Toshinobu Ogiso, Mamoru Komachi and Yuji Matsumoto. Morphological Analysis of Historical Japanese Text, Journal of Natural Language Processing, Vol.20, No.5, pp.727-748 (2013). [in Japanese]
  • Tomoaki Kouno and Toshinobu Ogiso. Improving an Electronic Dictionary for Morphological Analysis of Japanese: Use of historical period information, In Proceedings of The 9th International Conference of ASIALEX (ASIALEX2015) (2015). [can not read online]