2020年01月25日

Program List OCR 1.5.0リリース

Program List OCR 1.5.0のリリースです。

今回は主に英語圏向けのリリースです。
英語版のREADMEおよび言語ファイルを整備しました。
言語選択でn6xを選ぶとP6用のN6X-BASICに特化した認識、basを選ぶと汎用のBASIC言語になります。
basの場合は文字集合をASCIIに限定しているので、P6以外の和製機種でカナを認識したい場合は引き続きn6xをお使いください。

ダウンロードはこちらからお願いします。

【更新履歴】
1.5.0 2020/1/25
  • Tesseract,gImageReaderを更新
  • 汎用欧文BASIC言語ファイルおよび英語版ドキュメントを追加

posted by eighttails at 23:15| Comment(0) | Program List OCR | このブログの読者になる | 更新情報をチェックする

2019年08月12日

チェックサム検証ツール「Checksums」リリース

Program List OCRはマシン語のダンプリストの読み取りに対応していますが、OCRを使った場合はチェックサムも一緒に読み取られるため、チェックサムの検証器を作れば誤認識箇所の検出、訂正がスピーディーに行えるようになります。
今までその目的で自分用に使っていたツールを公開します。

PiOやPCマガジンなど、P6用の主要なダンプリスト掲載誌のフォーマットはカバーしていますが、ダンプリストは掲載誌によって(場合によってはプログラムの作者ごとに)計算方法や印刷の書式が異なるため、その都度チェックサムプログラムを修正して運用することを前提にしています。そのため利用するためにはPythonの環境やある程度の知識が必要になります。

こちらからチェックアウトしてご利用ください。




続きを読む
posted by eighttails at 15:14| Comment(0) | Program List OCR | このブログの読者になる | 更新情報をチェックする

2019年07月11日

Program List OCR 1.4.0リリース

Program List OCR 1.4.0のリリースです。
最近になってN-Fontの配布が再開されたようなので、今回からこちらのフォントも含めてOCRを学習させています。
PC-8001のスクリーンフォントを使って印字されたプログラムリストがどのくらいあるのか把握していませんが、P6のBASICやダンプリストなど、P8と関係ない機種のリストに対しても精度が上がっています。

ダウンロードはこちらからお願いします。

【更新履歴】
1.4.0 2019/7/11
  • Tesseract4.1.0の正式版に更新
  • 学習するフォントを追加



続きを読む
posted by eighttails at 20:14| Comment(0) | Program List OCR | このブログの読者になる | 更新情報をチェックする