「KMNISTデータセット」
MNIST のかな文字版・漢字版のデータセットが公開された由。
http://codh.rois.ac.jp/kmnist/
Kuzushiji-MNIST は既存の MNIST 用のコードがそのまま使えるはず。
ただし、かな文字のうち10文字だけで網羅していないのでサンプルの
位置づけでしょう。
実用的には Kuzushiji-Kanji を使用するのでしょうが、3832種類の
弁別をするのに140,426イメージというのは、データ量としてどうなの
でしょうか?また、どの位のメモリが必要になるのかな?
[関連記事]
2015-07-06 くずし字の読み取り
2017-01-14 みんなで翻刻
http://codh.rois.ac.jp/kmnist/
Kuzushiji-MNIST は既存の MNIST 用のコードがそのまま使えるはず。
ただし、かな文字のうち10文字だけで網羅していないのでサンプルの
位置づけでしょう。
実用的には Kuzushiji-Kanji を使用するのでしょうが、3832種類の
弁別をするのに140,426イメージというのは、データ量としてどうなの
でしょうか?また、どの位のメモリが必要になるのかな?
[関連記事]
2015-07-06 くずし字の読み取り
2017-01-14 みんなで翻刻
この記事へのコメント