allenai/olmocrPython18.1k
GitHubで見る →

Toolkit for linearizing PDFs for LLM datasets/training

技術情報

言語

Python

ライセンス

Apache-2.0

最終更新

2026-03-25

スター数

18,068

フォーク数

1,488

Issue数

81

関連リポジトリ