tomo.
tomo.
@tomo.chise.org
(ハルシネーション等の問題はあるものの、漢字文献読ませるなら VLM OCR は良いと言って良いだろう。ただ、現在進展中のものだから、色々並行して実験したいし、また、タスクによって重点化すべきポイントが結構違い、結局、ユニファイドメモリー系で高速な Mac と GPU は低速だけど CPU は早めな AMD, 低予算だと GPU メモリーが少なくなるが計算は早い NVIDIA の全部揃えてないと効率が悪いようだ。また、vLLM でクラスター組む技術もいるっぽい)
December 10, 2025 at 9:42 AM
(一方、Qwen3-VL-8B を使って「松島夜話」にかけた OCR 結果はできてた:
gitlab.nijl.ac.jp/Kotenseki/it...
ページ毎に形式が違うのと座標が謎なのがアレだが); 座標に関しては、なんとかしようとプロンプト工夫すると途端に超遅くなる(し、それでもうまくいかない)ので諦めた
Qwen3-VL-8B/text-md · master · Kotenseki / item / Matsushima-Yawa · GitLab
GitLab Community Edition
gitlab.nijl.ac.jp
December 9, 2025 at 11:31 PM
(昨晩動かした Qwen3-VL-30B-A3B を使ったスクリプトだが、一晩経ってもまだモデルのダウンロードが終わらない)
December 9, 2025 at 11:26 PM
(Qwen3-VL-8B って翻刻テキストをコピペしてるだけなんじゃないかと疑っていたが、ネットに転がってない気がする松島夜話も読めちゃったのでどうも本当に読んでるっぽい)
December 9, 2025 at 6:36 AM
(今度は Qwen3-VL-8B の環境を作って動かしてみたんだが、超遅い。なんかやってるっぽいが、これちゃんと動いてるんだろうか?)
December 9, 2025 at 3:10 AM
(試行錯誤の末、なんとか MINISFORUM MS-S1 Max に載せた Debian trixie 上で DeepSeek-OCR を動かすことに成功した。ただ、やっぱちょっと遅い)
December 8, 2025 at 1:55 PM
(MINISFORUM MS-S1 Max で TheRock を入れようとしているがうまくいかず実機の画面を見たらメモリーが足りないエラーが出てた。なんとなく GPU のメモリーを 96GB にしたが CPU のメモリー 32GB (しかも今は swap なしにしてる)だとコンパイルできないようだ。とりあえず、GPU 64GB, CPU 64GB にして再チャレンジ中)
December 8, 2025 at 2:57 AM
(DeepSeek-OCR に
kokusho.nijl.ac.jp/api/iiif/200...
を読ませてみたが崩字は全く読めなかった。
アラビア文字読めるって話なので原理的には学習させればできるのかもだが現状では無理っぽい)
November 25, 2025 at 2:44 AM
DeepSeek-OCR は縦書きの文字が大きいケース、例えば、
kokusho.nijl.ac.jp/api/iiif/200...
だと、L2R な縦書きとして読むっぽい
November 24, 2025 at 12:35 PM
(DeepSeek-OCR は現代語なら図や表や段組などの文書構造を理解するので、原理的に割注も理解できるはずだと思うけど、現実には理解しないのはおそらくコーパス(学習)が足りてないからだと思うので、この辺りを足したいがどうすれば良いんだろう?)
November 24, 2025 at 3:01 AM
(試しに DeepSeek-OCR に江戸期の康熙字典の版本を読ませてみたが、訓点無視して漢文読んでくれるというか、NDL古典籍OCRと比べてこいつは古典中国語を知ってるという感じがする(NDL古典籍OCRが日本語知ってる感じがするのと同様に)。ただ、割注はダメっぽい。テキストの画像化というのが効いてるかどうかは判らないが、画像の傾きにはシビアかもしれない。やっぱ、漢文のOCRには古典中国語の言語モデルが重要ってことかな?)
November 23, 2025 at 3:20 AM
(娘氏のマイクラマシンの Debian 13 Trixie が 13.2 にアップデートされたら Nvidia 環境が崩壊した。幸い、Proxmox の1時間ほど前の自動バックアップがあったのでこれに戻したら動いた。ただ、13.1 で固定するのも嫌だなと思って、13.2 に上げた VM に Nvidia driver を入れ直したら直った。ついでに、DeepSeek-OCR 実行環境を作るべく試行錯誤の結果、CUDA 12.4 環境で DeepSeek-OCR を動かすことに成功した)
November 23, 2025 at 3:09 AM
(LuaLaTeX で可換図式を書こうとしたら
lualatex Package xypdf Error: pdfTeX version 1.40.0 or higher is needed for the xypdf
というエラーが出るので焦ったが、ググったら
zenn.dev/wipiano/scra...
tex.stackexchange.com/questions/32...
にあるように
\RequirePackage{luatex85}
をプリアンブルに入れたら上手くいった)
LaTeX めも
いしころさんのスクラップ
zenn.dev
November 14, 2025 at 11:50 AM
石山裕慈先生から「動的視点からの日本漢字音史研究」をご恵贈いただきました。ありがとうございます。
このところ、DHSJR の CHISE への統合に取り組んでて、とても勉強になりました。まだまだわからないことだらけなんですが、研究史の一端が知れたのと、
第4章 字音仮名遣いの整備と現状―豪韻字の場合―
は日本漢字音の利用者への可視化における課題を考える上ですごく参考になりました。
全体的に、素人ながらとても面白かったです。
November 8, 2025 at 7:57 AM
今日の国語研での共同研究班で、
ja.wikipedia.org/wiki/%E3%83%...
の「全角ダッシュのマッピング問題」節の
「なお、JIS X 0213:2000には最初誤ってU+2015と印刷されていたが、2001年5月付けの正誤表で訂正された。」(ママ)
という記述の『2001年5月付けの正誤票』って見たことある?って話になって高田さんが図書室に探しに行った結果、現物を発見して、この記述が正しいことが確認された。
November 6, 2025 at 1:25 PM
何気に本撮りにも便利な気が。SnapBridge でのリモート撮影は Wi-Fi がすぐ切れて難ありだったが、自動連携を ON にしとくと勝手に iPhone に転送してくれるので便利 #NikonZR
November 4, 2025 at 11:00 AM
(娘氏しんどくて学校休んだんだけど、そもそも小学校が学級閉鎖になってた。知らんかったけど、都内でインフルエンザが流行ってるらしい
www.metro.tokyo.lg.jp/information/...
都内のインフルエンザ、注意報基準を超える|10月|都庁総合ホームページ
都内のインフルエンザ定点医療機関からの10月20日から10月26日(第43週)の患者報告数が10.37人となり、都の注意報基準を超えました。 今後、さらなる流行拡大の可能性があるため、インフルエンザの予防、拡大防止のために、引き続き、こまめな手洗い、消毒、咳エチケット等の基本的な感染予防策を一人ひとりが心がけてください。
www.metro.tokyo.lg.jp
November 4, 2025 at 4:24 AM
(このところ、Nikon ZR に FE 50mm F2.8 Macro を付けてるが、手ぶれ補正が効くのと AF の挙動がスーッと近づいて行ってピントがあったらブルブルしないので、画面が大きいこともあって、ぶっちゃけ α7IV より快適に撮れる。本を撮るのも楽。ただ、スマホアプリでの無線リモート撮影はすぐに Wi-Fi が切れるので、パソコンでのテザー撮影の方が良いのかも。机の配置を考えないと)
October 31, 2025 at 4:08 AM
(Nikon ZR 内蔵マイクも結構良いしモニターでかいので楽々動画撮影システムにも良さそうだけど、連続撮影時間最大125分縛りがあるので、シンポジウムの中継とかにはちょっと厳しそうである。惜しい)
October 27, 2025 at 4:29 AM
(従来版 CHISE IDS 漢字検索
www.chise.org/ids-find
は部品レベルの異体字関係や部品を組み上げた中間部品の異体字関係も探索して検索するので、時折、予想外の結果を出してくることがあるのだが、実際に文字レベルで異体字になってることがあるのであると便利なこともあるのだが、ちょっとびっくりすることもある。これに比べると IPFS 版は驚きが少ない。本当はオプション指定できると良いんだと思う)
CHISE IDS Find
www.chise.org
October 21, 2025 at 12:19 AM
(来年末に出るという Git 3.0 で SHA-256 がデフォになるのか www.phoronix.com/news/Git-3.0...
Git Developers Talk About Potentially Releasing Git 3.0 By The End Of Next Year
Git developers have been talking in recent weeks around release plans for Git 3.0
www.phoronix.com
October 12, 2025 at 12:46 PM
(Proxmox 上に娘氏用のマイクラ環境を構築して、その VM をコピーしてから mod 環境を作ったのだが、その過程でマインクラフトにもフレームワーク的な mod とか mod が利用する mod やマインクラフトのバージョンの依存関係とかがあってそうした依存関係を管理するパッケージマネージャー的なものがあることを知った。結局、これらは Java のプログラムで、一種の言語処理系なので、結局そうならざるをえないということか)
October 8, 2025 at 3:46 AM
(MOTU 848 が出たが、UltraLite AVB の第2世代も出ないかな?MILAN (AAF-PCM) に対応した AVB 対応スイッチ機能内蔵で、マイクプリアンプ2系統の小型オーディオインターフェース。まあ、でも、AVB 見捨てられてないようで安心。ただ、安価な 2.5GbE 以上対応の AVB スイッチが出ないとそろそろ辛い)
October 5, 2025 at 1:40 PM
(素の Debian 入れてから、
pve.proxmox.com/wiki/Install...
に従って proxmox-ve パッケージを入れた方が安全な感じ)
Install Proxmox VE on Debian 13 Trixie - Proxmox VE
pve.proxmox.com
October 2, 2025 at 2:16 PM
(Proxmox のインストーラーがワイルド過ぎ。ホットスワップベイに刺してた boot 用の SATA SSD は外してたのだが、内蔵してた NVMe SSD は面倒なのでそのままにしてたら問答無用で壊されてしまった。どうも最初の NVMe SSD にインストールする仕様っぽい。バックアップは取ってたのだが、娘氏のマイクラ用マシンだったので復旧まで怒られ続けた)
October 2, 2025 at 12:12 PM