「KMNISTデータセット」

MNIST のかな文字版・漢字版のデータセットが公開された由。

http://codh.rois.ac.jp/kmnist/

Kuzushiji-MNIST は既存の MNIST 用のコードがそのまま使えるはず。
ただし、かな文字のうち10文字だけで網羅していないのでサンプルの
位置づけでしょう。

実用的には Kuzushiji-Kanji を使用するのでしょうが、3832種類の
弁別をするのに140,426イメージというのは、データ量としてどうなの
でしょうか?また、どの位のメモリが必要になるのかな?

[関連記事]
 2015-07-06 くずし字の読み取り
 2017-01-14 みんなで翻刻

この記事へのコメント

この記事へのトラックバック