Edge, Chrome, Safari, Firefox推奨
UniDicのロゴ コーパス開発センターのロゴ
現代書き言葉UniDic unidic_bccwj

現代の書き言葉テキストを短単位自動解析するための解析用辞書です。 以下のようなテキストの解析に使用できます。

書籍、 雑誌、 新聞、 白書、 検定教科書、 広報紙、 Web掲示板、 ブログ、 韻文、 法律文書、 国会会議録 など

この解析用辞書を利用して行なった研究等の成果を公表する場合は、その旨を明記してください。 必要に応じて参考文献に挙げた文献を参照してください。

ライセンス
GPL/LGPL/BSD License

unidic_bccwj_download_button

旧バージョンはこちら

web_chamame

参考文献
  • 岡 照晃: 「CRF素性テンプレートの見直しによるモデルサイズを軽量化した解析用UniDic ― unidic-cwj-2.2.0 と unidic-csj-2.2.0 ― 」, 言語資源活用ワークショップ2017発表予稿集, pp.143-152 (2017).
  • 伝 康晴, 小木曽 智信, 小椋 秀樹, 山田 篤, 峯松 信明, 内元 清貴, 小磯 花絵: 「コーパス日本語学のための言語資源:形態素解析用電子化辞書の開発とその応用」, 日本語科学, Vol.22, pp.101-123 (2007).
現代話し言葉UniDic unidic_csj

現代の話し言葉テキストを短単位自動解析するための解析用辞書です。 以下のようなテキスト化された音声、もしくは話し言葉に近い文体のテキストの解析に使用できます。

学会講演、 朗読、 模擬講演、 インタビュー、 対話、 書籍、 Web掲示板、 ブログ など

CRFのモデルのコストが異なるだけで、辞書の語彙は現代書き言葉UniDicと同一です。

この解析用辞書を利用して行なった研究等の成果を公表する場合は、その旨を明記してください。 必要に応じて参考文献に挙げた文献を参照してください。

ライセンス
GPL/LGPL/BSD License

unidic_csj_download_button

旧バージョンはこちら

web_chamame

参考文献
  • 岡 照晃: 「CRF素性テンプレートの見直しによるモデルサイズを軽量化した解析用UniDic ― unidic-cwj-2.2.0 と unidic-csj-2.2.0 ― 」, 言語資源活用ワークショップ2017発表予稿集, pp.143-152 (2017).
  • 伝 康晴, 小木曽智信, 小椋 秀樹, 山田 篤, 峯松 信明, 内元 清貴, 小磯 花絵: 「コーパス日本語学のための言語資源:形態素解析用電子化辞書の開発とその応用」, 日本語科学, Vol.22, pp.101-123 (2007).
古文用UniDicS unidic_chj
  1. 旧仮名口語UniDic
  2. 近代文語UniDic
  3. 近世口語(洒落本)UniDic
  4. 中世口語(狂言)UniDic
  5. 中世文語(説話・随筆)UniDic
  6. 中古和文UniDic
  7. 上代(万葉集)UniDic
旧仮名口語UniDic unidic_chj

旧仮名口語で書かれたテキストを短単位自動解析するための解析用辞書です。 主として旧仮名口語で書かれた雑誌記事の解析に使用できます。

営利を目的として利用する場合には、下記問合せ先まで事前にご相談ください。

この解析用辞書を利用して行なった研究等の成果を公表する場合は、その旨を明記してください。 必要に応じて参考文献に挙げた文献を参照してください。

ライセンス
クリエイティブ・コモンズ・ライセンス

unidic_chj_download_button

旧バージョンはこちら

web_chamame

参考文献
  • 小木曽智信: 「旧仮名遣いの口語文を対象とした形態素解析辞書」, じんもんこん2012論文集, pp.25-32 (2012).
近代文語UniDic unidic_chj

近代文語論説文を短単位自動解析するための解析用辞書です。 明六雑誌, 太陽, 国民之友のような近代の雑誌などの解析に使用できます。

営利を目的として利用する場合には、下記問合せ先まで事前にご相談ください。

この解析用辞書を利用して行なった研究等の成果を公表する場合は、その旨を明記してください。 必要に応じて参考文献に挙げた文献を参照してください。

ライセンス
クリエイティブ・コモンズ・ライセンス

unidic_chj_download_button

旧バージョンはこちら

web_chamame

参考文献
  • 小木曽 智信, 小町 守, 松本 裕治: 「歴史的日本語資料を対象とした形態素解析」, 自然言語処理, Vol.20, No.5, pp.727-748 (2013).
近世口語(洒落本)UniDic unidic_chj

近世の口語資料を短単位自動解析するための解析用辞書です。 主とし、洒落本や人情本テキストの解析に使用できます。

営利を目的として利用する場合には、下記問合せ先まで事前にご相談ください。

この解析用辞書を利用して行なった研究等の成果を公表する場合は、その旨を明記してください。 必要に応じて参考文献に挙げた文献を参照してください。

ライセンス
クリエイティブ・コモンズ・ライセンス

unidic_chj_download_button

旧バージョンはこちら

web_chamame

参考文献
  • 小木曽 智信, 市村 太郎, 鴻野知暁: 「近世口語資料の形態素解析の試み」, 第4回コーパス日本語学ワークショップ予稿集, pp.145-150 (2013).
中世口語(狂言)UniDic unidic_chj

中世の口語資料、主として狂言台本を短単位自動解析するための解析用辞書です。 虎明本狂言集のようなテキストの解析に使用できます。

営利を目的として利用する場合には、下記問合せ先まで事前にご相談ください。

この解析用辞書を利用して行なった研究等の成果を公表する場合は、その旨を明記してください。 必要に応じて参考文献に挙げた文献を参照してください。

ライセンス
クリエイティブ・コモンズ・ライセンス

unidic_chj_download_button

旧バージョンはこちら

web_chamame

参考文献
  • 小木曽 智信, 鴻野 知暁, 市村 太郎: 「狂言台本の形態素解析」, 日本語学会2015年度春季大会 (2015).
中世文語(説話・随筆)UniDic unidic_chj

中世文語(説話・随筆)を短単位自動解析するための解析用辞書です。 以下のようなテキストの解析に使用できます。

今昔物語集(本朝部), 宇治拾遺物語, 十訓抄, 方丈記, 徒然草 など

営利を目的として利用する場合には、下記問合せ先まで事前にご相談ください。

この解析用辞書を利用して行なった研究等の成果を公表する場合は、その旨を明記してください。 必要に応じて参考文献に挙げた文献を参照してください。

ライセンス
クリエイティブ・コモンズ・ライセンス

unidic_chj_download_button

旧バージョンはこちら

web_chamame

参考文献
  • 小木曽 智信, 小町 守, 松本 裕治: 「歴史的日本語資料を対象とした形態素解析」, 自然言語処理, Vol.20, No.5, pp.727-748 (2013).
中古和文UniDic unidic_chj

中古和文を短単位自動解析するための解析用辞書です。 以下のようなテキストの解析に使用できます。

古今和歌集, 土佐日記, 竹取物語, 伊勢物語, 落窪物語, 大和物語, 枕草子, 源氏物語, 紫式部日記, 和泉式部日記, 平中物語, 堤中納言物語, 更級日記, 讃岐典侍日記, 蜻蛉日記, 大鏡 など

営利を目的として利用する場合には、下記問合せ先まで事前にご相談ください。

この解析用辞書を利用して行なった研究等の成果を公表する場合は、その旨を明記してください。 必要に応じて参考文献に挙げた文献を参照してください。

ライセンス
クリエイティブ・コモンズ・ライセンス

unidic_chj_download_button

旧バージョンはこちら

web_chamame

参考文献
  • 小木曽 智信, 小椋 秀樹, 田中 牧郎, 近藤 明日子, 伝 康晴: 「中古和文を対象とした形態素解析辞書の開発」, 情報処理学会研究報告 人文科学とコンピュータ, Vol.2010-CH-85, No.4, pp.1-8 (2010).
  • Toshinobu Ogiso, Mamoru Komachi, Yasuharu Den and Yuji Matsumoto. UniDic for Early Middle Japanese: a Dictionary for Morphological Analysis of Classical Japanese, In Proceedings of the 8th International Conference on Language Resources and Evaluation (LREC 2012), pp.911-915 (2012).
  • 小木曽智信: 「中古仮名文学作品の形態素解析」, 日本語の研究, Vol.9, No.4, pp.49-6 (2013).
  • 小木曽 智信, 小町 守, 松本 裕治: 「歴史的日本語資料を対象とした形態素解析」, 自然言語処理, Vol.20, No.5, pp.727-748 (2013).
上代(万葉集)UniDic unidic_chj

万葉集を短単位自動解析するための解析用辞書です。

営利を目的として利用する場合には、下記問合せ先まで事前にご相談ください。

この解析用辞書を利用して行なった研究等の成果を公表する場合は、その旨を明記してください。 必要に応じて参考文献に挙げた文献を参照してください。

ライセンス
クリエイティブ・コモンズ・ライセンス

unidic_chj_download_button

旧バージョンはこちら

web_chamame

参考文献
  • 小木曽 智信, 小町 守, 松本 裕治: 「歴史的日本語資料を対象とした形態素解析」, 自然言語処理, Vol.20, No.5, pp.727-748 (2013).