Edge, Chrome, Safari, Firefox推奨
UniDicのロゴ コーパス開発センターのロゴ
利用上の注意

CC-BY-NC-SAおよびフリーライセンスであっても、営利を目的として利用する場合には、下記問合せ先まで連絡・ご相談ください。

また以下の解析用辞書を利用して行なった研究等の成果を公表する場合は、その旨を明記してください。 必要に応じて参考文献に挙げた文献を参照してください。 UniDicの利用状況を把握する際の集計に使用させていただきます。

ライセンスの都合上、Ver.2.x、1603系よりも前の解析用辞書に関してはコーパス開発センターおよび本サイトでの配布・サポートの対象外となりました。すでにダウンロードされた方で、今後もし御質問等ございましたら、辞書に同梱のライセンスファイルに記載されている担当者に直接ご連絡いただくようお願い申し上げます。 ご不便をおかけしますが、何卒ご了承ください。

現代語用UniDicS
  1. 現代書き言葉UniDic
  2. 現代話し言葉UniDic
古文用UniDicS
  1. 旧仮名口語UniDic
  2. 近代文語UniDic
  3. 近世口語(洒落本)UniDic
  4. 中世口語(狂言)UniDic
  5. 中世文語(説話・随筆)UniDic
  6. 中古和文UniDic
  7. 上代(万葉集)UniDic
現代書き言葉UniDic
File nameRelease dateLicenceNote
unidic-cwj-3.1.0.zip 2021-04-01 GPL/LGPL/BSD ライセンスに同意してダウンロード 語彙サイズ(UTF-8)
matrix.def, model.defが付属しない軽量ダウンロード版です。(530MG)
unidic-cwj-3.1.0-full.zip 2021-04-01 GPL/LGPL/BSD ライセンスに同意してダウンロード 語彙サイズ(UTF-8)
モデルの学習・出力に使用したmatrix.def, model.defが付属するバージョンです。(ファイルサイズが1.6Gと非常に大きいので、ダウンロードの際は注意してください。
unidic-cwj-2.3.0.zip 2018-04-10 GPL/LGPL/BSD ライセンスに同意してダウンロード ファイルサイズが2.2Gと非常に大きいので、ダウンロードの際は注意してください。
unidic-cwj-2.3.0_beta.zip 2018-03-29 GPL/LGPL/BSD 試験公開です。フルパッケージ化した正式版は4月上旬に公開予定。[2018/04/10]試験公開終了。
unidic-cwj-2.2.0.zip 2017-09-05 GPL/LGPL/BSD ライセンスに同意してダウンロード [2017/09/06]dicrcのchamame出力フォーマットを修正しました。[2017/10/02]ライセンスファイルをzip内に追加しました。[2017/12/14]1603系のライセンスファイル(LICENSE)が誤ってパッケージングされていたため、削除しました。
参考文献
  • 岡 照晃: 「CRF素性テンプレートの見直しによるモデルサイズを軽量化した解析用UniDic ― unidic-cwj-2.2.0 と unidic-csj-2.2.0 ― 」, 言語資源活用ワークショップ2017発表予稿集, pp.143-152 (2017).
References
謝辞

本研究は国立国語研究所コーパス開発センターの共同研究プロジェクト 「コーパスアノテーションの拡張・統合・自動化に関する基礎研究」(2016-2021 年度) の成果である。



File nameRelease dateLicenceNote
unidic-mecab-2.1.2_bin.zip 2013-03-14 GPL/LGPL/BSD ライセンスに同意してダウンロード OSDNで公開していたバージョン(2013/3/14)の再公開
unidic-mecab-2.1.2_src.zip 2013-03-14 GPL/LGPL/BSD ライセンスに同意してダウンロード OSDNで公開していたバージョン(2013/3/14)の再公開
unidic-mecab-2.1.2_model.zip 2013-03-14 GPL/LGPL/BSD ライセンスに同意してダウンロード OSDNで公開していたバージョン(2013/3/14)の再公開
unidic-mecab_kana-accent-2.1.2_src.zip 2013-03-14 GPL/LGPL/BSD ライセンスに同意してダウンロード OSDNで公開していたバージョン(2013/3/14)の再公開
unidic-mecab-211_bin.zip 2012-12-13 GPL/LGPL/BSD ライセンスに同意してダウンロード OSDNで公開していたバージョン(2012/12/13)の再公開
unidic-mecab-211_windows.zip 2012-12-13 GPL/LGPL/BSD ライセンスに同意してダウンロード OSDNで公開していたバージョン(2012/12/13)の再公開
unidic-mecab-211_src.zip 2012-12-13 GPL/LGPL/BSD ライセンスに同意してダウンロード OSDNで公開していたバージョン(2012/12/13)の再公開
unidic-mecab-211_model.zip 2012-12-13 GPL/LGPL/BSD ライセンスに同意してダウンロード OSDNで公開していたバージョン(2012/12/13)の再公開
File nameRelease dateLicenceNote
UniDic-gendai_1603.zip 2016-03 GPL/LGPL/BSD ライセンスに同意してダウンロード Web茶まめで公開していたバージョン(2016/3)の再公開[2018/03/19]学習時に使用されたdefファイルをzip内に追加しました。
参考文献
References
現代話し言葉UniDic
File nameRelease dateLicenceNote
unidic-csj-3.1.0.zip 2021-04-01 GPL/LGPL/BSD ライセンスに同意してダウンロード 語彙サイズ(UTF-8)
matrix.def, model.defが付属しない軽量ダウンロード版です。(530MB)
unidic-csj-3.1.0-full.zip 2021-04-01 GPL/LGPL/BSD ライセンスに同意してダウンロード 語彙サイズ(UTF-8)
モデルの学習・出力に使用したmatrix.def, model.defが付属するバージョンです。(ファイルサイズが1.7Gと非常に大きいので、ダウンロードの際は注意してください。
unidic-csj-3.0.1.1.zip 2020-02-21 GPL/LGPL/BSD ライセンスに同意してダウンロード 語彙サイズ(UTF-8)
ファイルサイズが1.5Gと非常に大きいので、ダウンロードの際は注意してください。3.0.1からの変更点は、連接行列の圧縮スクリプトを改良し、matrix.defのサイズが4.3Gから3.6Gになっただけで解析性能等の変更はありません。
unidic-csj-3.0.1.zip 2019-12-17 GPL/LGPL/BSD ライセンスに同意してダウンロード 語彙サイズ(UTF-8)
ファイルサイズが1.6Gと非常に大きいので、ダウンロードの際は注意してください。
参考文献
  • 岡 照晃: 「言語研究のための電子化辞書」, コーパスと辞書, 講座 日本語コーパス 7, pp.1-28, 朝倉書店 (2019).
References
  • Yasuharu Den, Junpei Nakamura, Toshinobu Ogiso, Hideki Ogura. A Proper Approach to Japanese Morphological Analysis: Dictionary, Model, and Evaluation, In Proceedings of the sixth international conference on Language Resources and Evaluation (LREC 2008), pp.1019-1024 (2008).
謝辞

本研究は国立国語研究所コーパス開発センターの共同研究プロジェクト 「コーパスアノテーションの拡張・統合・自動化に関する基礎研究」(2016-2021 年度) の成果である。



File nameRelease dateLicenceNote
unidic-csj-2.3.0.zip 2018-04-10 GPL/LGPL/BSD ライセンスに同意してダウンロード ファイルサイズが2.2Gと非常に大きいので、ダウンロードの際は注意してください。
unidic-csj-2.3.0_beta.zip 2018-03-29 GPL/LGPL/BSD 試験公開です。フルパッケージ化した正式版は4月上旬に公開予定。[2018/04/10]試験公開終了。
unidic-csj-2.2.0.zip 2017-09-05 GPL/LGPL/BSD ライセンスに同意してダウンロード [2017/09/06]dicrcのchamame出力フォーマットを修正しました。[2017/10/02]ライセンスファイルをzip内に追加しました。
参考文献
  • 岡 照晃: 「CRF素性テンプレートの見直しによるモデルサイズを軽量化した解析用UniDic ― unidic-cwj-2.2.0 と unidic-csj-2.2.0 ― 」, 言語資源活用ワークショップ2017発表予稿集, pp.143-152 (2017).
References
  • Yasuharu Den, Junpei Nakamura, Toshinobu Ogiso, Hideki Ogura. A Proper Approach to Japanese Morphological Analysis: Dictionary, Model, and Evaluation, In Proceedings of the sixth international conference on Language Resources and Evaluation (LREC 2008), pp.1019-1024 (2008).
謝辞

本研究は国立国語研究所コーパス開発センターの共同研究プロジェクト 「コーパスアノテーションの拡張・統合・自動化に関する基礎研究」(2016-2021 年度) の成果である。



File nameRelease dateLicenceNote
UniDic-spoken_1603.zip 2016-03 クリエイティブ・コモンズ・ライセンス ライセンスに同意してダウンロード Web茶まめで公開していたバージョン(2016/3)の再公開[2018/03/19]学習時に使用されたdefファイルをzip内に追加しました。
参考文献
References
  • Yasuharu Den, Junpei Nakamura, Toshinobu Ogiso, Hideki Ogura. A Proper Approach to Japanese Morphological Analysis: Dictionary, Model, and Evaluation, In Proceedings of the sixth international conference on Language Resources and Evaluation (LREC 2008), pp.1019-1024 (2008).
旧仮名口語UniDic
File nameRelease dateLicenceNote
UniDic-qkana_1603.zip 2016-03 クリエイティブ・コモンズ・ライセンス ライセンスに同意してダウンロード Web茶まめで公開していたバージョン(2016/3)の再公開[2017/10/31]ライセンスファイルをzip内に追加しました。[2018/03/09]学習時に使用されたdefファイルをzip内に追加しました。
参考文献
  • 小木曽智信: 「旧仮名遣いの口語文を対象とした形態素解析辞書」, じんもんこん2012論文集, pp.25-32 (2012).
References
  • Toshinobu Ogiso, Mamoru Komachi and Yuji Matsumoto. Morphological Analysis of Historical Japanese Text, Journal of Natural Language Processing, Vol.20, No.5, pp.727-748 (2013). [in Japanese]
  • Tomoaki Kouno and Toshinobu Ogiso. Improving an Electronic Dictionary for Morphological Analysis of Japanese: Use of historical period information, In Proceedings of The 9th International Conference of ASIALEX (ASIALEX2015) (2015). [can not read online]
近代文語UniDic
File nameRelease dateLicenceNote
UniDic-kindai_1603.zip 2016-03 クリエイティブ・コモンズ・ライセンス ライセンスに同意してダウンロード Web茶まめで公開していたバージョン(2016/3)の再公開[2017/10/31]ライセンスファイルをzip内に追加しました。[2018/03/09]学習時に使用されたdefファイルをzip内に追加しました。
unidic-MLJ_14.zip 2014-03-31 配布終了しました 近代文語UniDic専用ページで公開していたバージョン(2014/3/31)の再公開[2017/12/07]コーパス開発センターでの配布及びサポートを終了しました。
参考文献
  • 小木曽 智信, 小町 守, 松本 裕治: 「歴史的日本語資料を対象とした形態素解析」, 自然言語処理, Vol.20, No.5, pp.727-748 (2013).
References
  • Toshinobu Ogiso, Mamoru Komachi and Yuji Matsumoto. Morphological Analysis of Historical Japanese Text, Journal of Natural Language Processing, Vol.20, No.5, pp.727-748 (2013). [in Japanese]
  • Tomoaki Kouno and Toshinobu Ogiso. Improving an Electronic Dictionary for Morphological Analysis of Japanese: Use of historical period information, In Proceedings of The 9th International Conference of ASIALEX (ASIALEX2015) (2015). [can not read online]
近世口語(洒落本)UniDic
File nameRelease dateLicenceNote
UniDic-kinsei_1603.zip 2016-03 クリエイティブ・コモンズ・ライセンス ライセンスに同意してダウンロード Web茶まめで公開していたバージョン(2016/3)の再公開[2017/10/31]ライセンスファイルをzip内に追加しました。[2018/03/09]学習時に使用されたdefファイルをzip内に追加しました。
参考文献
  • 小木曽 智信, 市村 太郎, 鴻野知暁: 「近世口語資料の形態素解析の試み」, 第4回コーパス日本語学ワークショップ予稿集, pp.145-150 (2013).
References
  • Toshinobu Ogiso, Mamoru Komachi and Yuji Matsumoto. Morphological Analysis of Historical Japanese Text, Journal of Natural Language Processing, Vol.20, No.5, pp.727-748 (2013). [in Japanese]
  • Tomoaki Kouno and Toshinobu Ogiso. Improving an Electronic Dictionary for Morphological Analysis of Japanese: Use of historical period information, In Proceedings of The 9th International Conference of ASIALEX (ASIALEX2015) (2015). [can not read online]
中世口語(狂言)UniDic
File nameRelease dateLicenceNote
UniDic-kyogen_1603.zip 2016-03 クリエイティブ・コモンズ・ライセンス ライセンスに同意してダウンロード Web茶まめで公開していたバージョン(2016/3)の再公開[2017/10/31]ライセンスファイルをzip内に追加しました。[2018/03/09]学習時に使用されたdefファイルをzip内に追加しました。
参考文献
  • 小木曽 智信, 鴻野 知暁, 市村 太郎: 「狂言台本の形態素解析」, 日本語学会2015年度春季大会 (2015). [can not read online]
References
  • Toshinobu Ogiso, Mamoru Komachi and Yuji Matsumoto. Morphological Analysis of Historical Japanese Text, Journal of Natural Language Processing, Vol.20, No.5, pp.727-748 (2013). [in Japanese]
  • Tomoaki Kouno and Toshinobu Ogiso. Improving an Electronic Dictionary for Morphological Analysis of Japanese: Use of historical period information, In Proceedings of The 9th International Conference of ASIALEX (ASIALEX2015) (2015). [can not read online]
中世文語(説話・随筆)UniDic
File nameRelease dateLicenceNote
UniDic-wakan_1603.zip 2016-03 クリエイティブ・コモンズ・ライセンス ライセンスに同意してダウンロード Web茶まめで公開していたバージョン(2016/3)の再公開[2017/10/31]ライセンスファイルをzip内に追加しました。[2018/03/09]学習時に使用されたdefファイルをzip内に追加しました。
参考文献
  • 小木曽 智信, 小町 守, 松本 裕治: 「歴史的日本語資料を対象とした形態素解析」, 自然言語処理, Vol.20, No.5, pp.727-748 (2013).
References
  • Toshinobu Ogiso, Mamoru Komachi and Yuji Matsumoto. Morphological Analysis of Historical Japanese Text, Journal of Natural Language Processing, Vol.20, No.5, pp.727-748 (2013). [in Japanese]
  • Tomoaki Kouno and Toshinobu Ogiso. Improving an Electronic Dictionary for Morphological Analysis of Japanese: Use of historical period information, In Proceedings of The 9th International Conference of ASIALEX (ASIALEX2015) (2015). [can not read online]
中古和文UniDic
File nameRelease dateLicenceNote
UniDic-wabun_1603.zip 2016-03 クリエイティブ・コモンズ・ライセンス ライセンスに同意してダウンロード Web茶まめで公開していたバージョン(2016/3)の再公開[2017/10/31]ライセンスファイルをzip内に追加しました。[2018/03/09]学習時に使用されたdefファイルをzip内に追加しました。
unidic-EMJ_14.zip 2014-03-31 配布終了しました 中古和文UniDic専用ページで公開していたバージョン(2014/3/31)の再公開[2017/12/07]コーパス開発センターでの配布及びサポートを終了しました。
参考文献
  • 小木曽 智信, 小椋 秀樹, 田中 牧郎, 近藤 明日子, 伝 康晴: 「中古和文を対象とした形態素解析辞書の開発」, 情報処理学会研究報告 人文科学とコンピュータ, Vol.2010-CH-85, No.4, pp.1-8 (2010).
  • 小木曽智信: 「中古仮名文学作品の形態素解析」, 日本語の研究, Vol.9, No.4, pp.49-6 (2013).
  • 小木曽 智信, 小町 守, 松本 裕治: 「歴史的日本語資料を対象とした形態素解析」, 自然言語処理, Vol.20, No.5, pp.727-748 (2013).
References
  • Toshinobu Ogiso, Mamoru Komachi, Yasuharu Den and Yuji Matsumoto. UniDic for Early Middle Japanese: a Dictionary for Morphological Analysis of Classical Japanese, In Proceedings of the 8th International Conference on Language Resources and Evaluation (LREC 2012), pp.911-915 (2012).
上代(万葉集)UniDic
File nameRelease dateLicenceNote
UniDic-manyo_1603.zip 2016-03 クリエイティブ・コモンズ・ライセンス ライセンスに同意してダウンロード Web茶まめで公開していたバージョン(2016/3)の再公開[2017/10/31]ライセンスファイルをzip内に追加しました。[2018/03/09]学習時に使用されたdefファイルをzip内に追加しました。
参考文献
  • 小木曽 智信, 小町 守, 松本 裕治: 「歴史的日本語資料を対象とした形態素解析」, 自然言語処理, Vol.20, No.5, pp.727-748 (2013).
References
  • Toshinobu Ogiso, Mamoru Komachi and Yuji Matsumoto. Morphological Analysis of Historical Japanese Text, Journal of Natural Language Processing, Vol.20, No.5, pp.727-748 (2013). [in Japanese]
  • Tomoaki Kouno and Toshinobu Ogiso. Improving an Electronic Dictionary for Morphological Analysis of Japanese: Use of historical period information, In Proceedings of The 9th International Conference of ASIALEX (ASIALEX2015) (2015). [can not read online]