デイリーHuggingFaceトレンド
@huggingfacetrends.bsky.social
Hugging Face( https://huggingface.co/models )から5つをピックアップし、毎日19時過ぎにリポジトリの内容を要約して投稿します。
ソースコードの配布は「 https://github.com/aegisfleet/hugging-face-trending-to-bluesky 」で行っています。
GitHubトレンド: @dailygithubtrends.bsky.social
Zennトレンド: @dailyzenntrends.bsky.social
ソースコードの配布は「 https://github.com/aegisfleet/hugging-face-trending-to-bluesky 」で行っています。
GitHubトレンド: @dailygithubtrends.bsky.social
Zennトレンド: @dailyzenntrends.bsky.social
今日のHuggingFaceトレンド
briaai/FIBO
本リポジトリは、構造化されたJSONキャプションで学習されたテキスト画像生成モデルFIBOの重みを提供する。
プロフェッショナル利用を想定し、照明や構図などを精密に、反復的に制御できる高い制御性と分離性を実現することを目的とする。
briaai/FIBO
本リポジトリは、構造化されたJSONキャプションで学習されたテキスト画像生成モデルFIBOの重みを提供する。
プロフェッショナル利用を想定し、照明や構図などを精密に、反復的に制御できる高い制御性と分離性を実現することを目的とする。
briaai/FIBO · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
huggingface.co
November 10, 2025 at 10:20 AM
今日のHuggingFaceトレンド
briaai/FIBO
本リポジトリは、構造化されたJSONキャプションで学習されたテキスト画像生成モデルFIBOの重みを提供する。
プロフェッショナル利用を想定し、照明や構図などを精密に、反復的に制御できる高い制御性と分離性を実現することを目的とする。
briaai/FIBO
本リポジトリは、構造化されたJSONキャプションで学習されたテキスト画像生成モデルFIBOの重みを提供する。
プロフェッショナル利用を想定し、照明や構図などを精密に、反復的に制御できる高い制御性と分離性を実現することを目的とする。
今日のHuggingFaceトレンド
vafipas663/Qwen-Edit-2509-Upscale-LoRA
本リポジトリは、QwenベースのモデルとLighting LoRAを用いて、実写画像の品質を強調および向上させることを目的としている。
低解像度、ノイズ、ブラー、圧縮アーティファクトなど、多様な劣化を含む画像を修復し、効果的にアップスケールする機能を提供する。
訓練中のモデルのチェックポイントが共有されており、ComfyUIのワークフローも提供されている。
vafipas663/Qwen-Edit-2509-Upscale-LoRA
本リポジトリは、QwenベースのモデルとLighting LoRAを用いて、実写画像の品質を強調および向上させることを目的としている。
低解像度、ノイズ、ブラー、圧縮アーティファクトなど、多様な劣化を含む画像を修復し、効果的にアップスケールする機能を提供する。
訓練中のモデルのチェックポイントが共有されており、ComfyUIのワークフローも提供されている。
vafipas663/Qwen-Edit-2509-Upscale-LoRA · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
huggingface.co
November 10, 2025 at 10:20 AM
今日のHuggingFaceトレンド
vafipas663/Qwen-Edit-2509-Upscale-LoRA
本リポジトリは、QwenベースのモデルとLighting LoRAを用いて、実写画像の品質を強調および向上させることを目的としている。
低解像度、ノイズ、ブラー、圧縮アーティファクトなど、多様な劣化を含む画像を修復し、効果的にアップスケールする機能を提供する。
訓練中のモデルのチェックポイントが共有されており、ComfyUIのワークフローも提供されている。
vafipas663/Qwen-Edit-2509-Upscale-LoRA
本リポジトリは、QwenベースのモデルとLighting LoRAを用いて、実写画像の品質を強調および向上させることを目的としている。
低解像度、ノイズ、ブラー、圧縮アーティファクトなど、多様な劣化を含む画像を修復し、効果的にアップスケールする機能を提供する。
訓練中のモデルのチェックポイントが共有されており、ComfyUIのワークフローも提供されている。
今日のHuggingFaceトレンド
moonshotai/Kimi-Linear-48B-A3B-Instruct
Kimi Linearというハイブリッド線形アテンションアーキテクチャを公開すること。
これはKimi Delta Attention(KDA)を核とし、従来のフルアテンションを上回る性能とハードウェア効率を、特に長文コンテキスト(最大1Mトークン)処理で実現する。
KDAカーネルと学習済みモデルチェックポイントが提供される。
moonshotai/Kimi-Linear-48B-A3B-Instruct
Kimi Linearというハイブリッド線形アテンションアーキテクチャを公開すること。
これはKimi Delta Attention(KDA)を核とし、従来のフルアテンションを上回る性能とハードウェア効率を、特に長文コンテキスト(最大1Mトークン)処理で実現する。
KDAカーネルと学習済みモデルチェックポイントが提供される。
moonshotai/Kimi-Linear-48B-A3B-Instruct · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
huggingface.co
November 10, 2025 at 10:20 AM
今日のHuggingFaceトレンド
moonshotai/Kimi-Linear-48B-A3B-Instruct
Kimi Linearというハイブリッド線形アテンションアーキテクチャを公開すること。
これはKimi Delta Attention(KDA)を核とし、従来のフルアテンションを上回る性能とハードウェア効率を、特に長文コンテキスト(最大1Mトークン)処理で実現する。
KDAカーネルと学習済みモデルチェックポイントが提供される。
moonshotai/Kimi-Linear-48B-A3B-Instruct
Kimi Linearというハイブリッド線形アテンションアーキテクチャを公開すること。
これはKimi Delta Attention(KDA)を核とし、従来のフルアテンションを上回る性能とハードウェア効率を、特に長文コンテキスト(最大1Mトークン)処理で実現する。
KDAカーネルと学習済みモデルチェックポイントが提供される。
今日のHuggingFaceトレンド
MiniMaxAI/MiniMax-M2
このリポジトリは、MiniMax-M2というオープンソースの混合エキスパート(MoE)モデルを公開する。
これは、コーディングとエージェントワークフローに特化して設計されており、「最大級のコーディングとエージェント処理」を目的とする。
少ないアクティブパラメータで高い一般知能と高度なツール使用性能を実現し、開発者のタスク実行とスケーリングの効率化を目指している。
MiniMaxAI/MiniMax-M2
このリポジトリは、MiniMax-M2というオープンソースの混合エキスパート(MoE)モデルを公開する。
これは、コーディングとエージェントワークフローに特化して設計されており、「最大級のコーディングとエージェント処理」を目的とする。
少ないアクティブパラメータで高い一般知能と高度なツール使用性能を実現し、開発者のタスク実行とスケーリングの効率化を目指している。
MiniMaxAI/MiniMax-M2 · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
huggingface.co
November 10, 2025 at 10:20 AM
今日のHuggingFaceトレンド
MiniMaxAI/MiniMax-M2
このリポジトリは、MiniMax-M2というオープンソースの混合エキスパート(MoE)モデルを公開する。
これは、コーディングとエージェントワークフローに特化して設計されており、「最大級のコーディングとエージェント処理」を目的とする。
少ないアクティブパラメータで高い一般知能と高度なツール使用性能を実現し、開発者のタスク実行とスケーリングの効率化を目指している。
MiniMaxAI/MiniMax-M2
このリポジトリは、MiniMax-M2というオープンソースの混合エキスパート(MoE)モデルを公開する。
これは、コーディングとエージェントワークフローに特化して設計されており、「最大級のコーディングとエージェント処理」を目的とする。
少ないアクティブパラメータで高い一般知能と高度なツール使用性能を実現し、開発者のタスク実行とスケーリングの効率化を目指している。
今日のHuggingFaceトレンド
maya-research/maya1
Maya1は、現実の人間の感情と正確な声のデザインを捉えるために構築された、最先端のテキスト音声合成(TTS)モデルです。
リポジトリは、このモデルを通じて、エネルギッシュなイベントホストから怒りを表す悪役まで、多様なキャラクター、感情、アクセントを持つ表現力豊かな音声を生成することを目的としています。
maya-research/maya1
Maya1は、現実の人間の感情と正確な声のデザインを捉えるために構築された、最先端のテキスト音声合成(TTS)モデルです。
リポジトリは、このモデルを通じて、エネルギッシュなイベントホストから怒りを表す悪役まで、多様なキャラクター、感情、アクセントを持つ表現力豊かな音声を生成することを目的としています。
maya-research/maya1 · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
huggingface.co
November 10, 2025 at 10:20 AM
今日のHuggingFaceトレンド
maya-research/maya1
Maya1は、現実の人間の感情と正確な声のデザインを捉えるために構築された、最先端のテキスト音声合成(TTS)モデルです。
リポジトリは、このモデルを通じて、エネルギッシュなイベントホストから怒りを表す悪役まで、多様なキャラクター、感情、アクセントを持つ表現力豊かな音声を生成することを目的としています。
maya-research/maya1
Maya1は、現実の人間の感情と正確な声のデザインを捉えるために構築された、最先端のテキスト音声合成(TTS)モデルです。
リポジトリは、このモデルを通じて、エネルギッシュなイベントホストから怒りを表す悪役まで、多様なキャラクター、感情、アクセントを持つ表現力豊かな音声を生成することを目的としています。
今日のHuggingFaceトレンド
Phr00t/Qwen-Image-Edit-Rapid-AIO
本リポジトリは、ComfyUI向けに、Qwen Image Editの高速な画像編集およびテキストからの画像生成を可能にするアクセラレータ、VAE、CLIPを統合したチェックポイントを提供する。
入力画像の使用は任意であり、SFWおよびNSFWの両方に対応した最適化モデルバージョンが用意されている。
Phr00t/Qwen-Image-Edit-Rapid-AIO
本リポジトリは、ComfyUI向けに、Qwen Image Editの高速な画像編集およびテキストからの画像生成を可能にするアクセラレータ、VAE、CLIPを統合したチェックポイントを提供する。
入力画像の使用は任意であり、SFWおよびNSFWの両方に対応した最適化モデルバージョンが用意されている。
Phr00t/Qwen-Image-Edit-Rapid-AIO · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
huggingface.co
November 9, 2025 at 10:16 AM
今日のHuggingFaceトレンド
Phr00t/Qwen-Image-Edit-Rapid-AIO
本リポジトリは、ComfyUI向けに、Qwen Image Editの高速な画像編集およびテキストからの画像生成を可能にするアクセラレータ、VAE、CLIPを統合したチェックポイントを提供する。
入力画像の使用は任意であり、SFWおよびNSFWの両方に対応した最適化モデルバージョンが用意されている。
Phr00t/Qwen-Image-Edit-Rapid-AIO
本リポジトリは、ComfyUI向けに、Qwen Image Editの高速な画像編集およびテキストからの画像生成を可能にするアクセラレータ、VAE、CLIPを統合したチェックポイントを提供する。
入力画像の使用は任意であり、SFWおよびNSFWの両方に対応した最適化モデルバージョンが用意されている。
今日のHuggingFaceトレンド
datalab-to/chandra
このリポジトリは、画像やPDFからテキストを高精度で抽出し、レイアウト情報(Markdown、HTML、JSON形式)を保持して出力するOCRモデル「Chandra」を提供することを目的としている。
利用者向けにCLIツールやライブラリを通じた導入方法を提示し、ベンチマークを通じて他の主要なOCRモデルに対する性能の優位性を強調している。
datalab-to/chandra
このリポジトリは、画像やPDFからテキストを高精度で抽出し、レイアウト情報(Markdown、HTML、JSON形式)を保持して出力するOCRモデル「Chandra」を提供することを目的としている。
利用者向けにCLIツールやライブラリを通じた導入方法を提示し、ベンチマークを通じて他の主要なOCRモデルに対する性能の優位性を強調している。
datalab-to/chandra · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
huggingface.co
November 9, 2025 at 10:16 AM
今日のHuggingFaceトレンド
datalab-to/chandra
このリポジトリは、画像やPDFからテキストを高精度で抽出し、レイアウト情報(Markdown、HTML、JSON形式)を保持して出力するOCRモデル「Chandra」を提供することを目的としている。
利用者向けにCLIツールやライブラリを通じた導入方法を提示し、ベンチマークを通じて他の主要なOCRモデルに対する性能の優位性を強調している。
datalab-to/chandra
このリポジトリは、画像やPDFからテキストを高精度で抽出し、レイアウト情報(Markdown、HTML、JSON形式)を保持して出力するOCRモデル「Chandra」を提供することを目的としている。
利用者向けにCLIツールやライブラリを通じた導入方法を提示し、ベンチマークを通じて他の主要なOCRモデルに対する性能の優位性を強調している。
今日のHuggingFaceトレンド
deepseek-ai/DeepSeek-OCR
DeepSeek-OCRは、視覚テキスト圧縮技術を探求し実現することを目的としたリポジトリである。
画像ドキュメントを効率的にテキスト化するOCR機能(光学文字認識)を提供し、文書のMarkdown変換などのタスクに対応する。
Hugging Face Transformersを用いた推論実行環境を提供しており、vLLMによるアクセラレーションにも対応している。
deepseek-ai/DeepSeek-OCR
DeepSeek-OCRは、視覚テキスト圧縮技術を探求し実現することを目的としたリポジトリである。
画像ドキュメントを効率的にテキスト化するOCR機能(光学文字認識)を提供し、文書のMarkdown変換などのタスクに対応する。
Hugging Face Transformersを用いた推論実行環境を提供しており、vLLMによるアクセラレーションにも対応している。
deepseek-ai/DeepSeek-OCR · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
huggingface.co
November 9, 2025 at 10:15 AM
今日のHuggingFaceトレンド
deepseek-ai/DeepSeek-OCR
DeepSeek-OCRは、視覚テキスト圧縮技術を探求し実現することを目的としたリポジトリである。
画像ドキュメントを効率的にテキスト化するOCR機能(光学文字認識)を提供し、文書のMarkdown変換などのタスクに対応する。
Hugging Face Transformersを用いた推論実行環境を提供しており、vLLMによるアクセラレーションにも対応している。
deepseek-ai/DeepSeek-OCR
DeepSeek-OCRは、視覚テキスト圧縮技術を探求し実現することを目的としたリポジトリである。
画像ドキュメントを効率的にテキスト化するOCR機能(光学文字認識)を提供し、文書のMarkdown変換などのタスクに対応する。
Hugging Face Transformersを用いた推論実行環境を提供しており、vLLMによるアクセラレーションにも対応している。
今日のHuggingFaceトレンド
dx8152/Qwen-Edit-2509-Multiple-angles
このリポジトリは、画像生成パイプライン(Diffusers)で使用されるLoraモデル「Qwen-Edit-2509」を提供する。
このモデルは、トリガーワードなしで、カメラの移動、回転、俯瞰、広角、特写などの視点やフレーミングを自然言語で詳細に制御可能にすることを主な目的としている。
整合性向上のための更新版であり、他のLoraとの併用が推奨されている。
dx8152/Qwen-Edit-2509-Multiple-angles
このリポジトリは、画像生成パイプライン(Diffusers)で使用されるLoraモデル「Qwen-Edit-2509」を提供する。
このモデルは、トリガーワードなしで、カメラの移動、回転、俯瞰、広角、特写などの視点やフレーミングを自然言語で詳細に制御可能にすることを主な目的としている。
整合性向上のための更新版であり、他のLoraとの併用が推奨されている。
dx8152/Qwen-Edit-2509-Multiple-angles · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
huggingface.co
November 9, 2025 at 10:15 AM
今日のHuggingFaceトレンド
dx8152/Qwen-Edit-2509-Multiple-angles
このリポジトリは、画像生成パイプライン(Diffusers)で使用されるLoraモデル「Qwen-Edit-2509」を提供する。
このモデルは、トリガーワードなしで、カメラの移動、回転、俯瞰、広角、特写などの視点やフレーミングを自然言語で詳細に制御可能にすることを主な目的としている。
整合性向上のための更新版であり、他のLoraとの併用が推奨されている。
dx8152/Qwen-Edit-2509-Multiple-angles
このリポジトリは、画像生成パイプライン(Diffusers)で使用されるLoraモデル「Qwen-Edit-2509」を提供する。
このモデルは、トリガーワードなしで、カメラの移動、回転、俯瞰、広角、特写などの視点やフレーミングを自然言語で詳細に制御可能にすることを主な目的としている。
整合性向上のための更新版であり、他のLoraとの併用が推奨されている。
今日のHuggingFaceトレンド
moonshotai/Kimi-K2-Thinking
このリポジトリは、最新のオープンソース思考モデル「Kimi K2 Thinking」を公開し、その詳細を提供するものです。
K2 Thinkingは、MoEアーキテクチャに基づき、ステップバイステップの推論と動的ツール呼び出しに特化しています。
256Kの長大なコンテキストとINT4量子化により、高い性能と効率性を両立させ、主要な推論ベンチマークで最先端の結果を示しています。
moonshotai/Kimi-K2-Thinking
このリポジトリは、最新のオープンソース思考モデル「Kimi K2 Thinking」を公開し、その詳細を提供するものです。
K2 Thinkingは、MoEアーキテクチャに基づき、ステップバイステップの推論と動的ツール呼び出しに特化しています。
256Kの長大なコンテキストとINT4量子化により、高い性能と効率性を両立させ、主要な推論ベンチマークで最先端の結果を示しています。
moonshotai/Kimi-K2-Thinking · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
huggingface.co
November 9, 2025 at 10:15 AM
今日のHuggingFaceトレンド
moonshotai/Kimi-K2-Thinking
このリポジトリは、最新のオープンソース思考モデル「Kimi K2 Thinking」を公開し、その詳細を提供するものです。
K2 Thinkingは、MoEアーキテクチャに基づき、ステップバイステップの推論と動的ツール呼び出しに特化しています。
256Kの長大なコンテキストとINT4量子化により、高い性能と効率性を両立させ、主要な推論ベンチマークで最先端の結果を示しています。
moonshotai/Kimi-K2-Thinking
このリポジトリは、最新のオープンソース思考モデル「Kimi K2 Thinking」を公開し、その詳細を提供するものです。
K2 Thinkingは、MoEアーキテクチャに基づき、ステップバイステップの推論と動的ツール呼び出しに特化しています。
256Kの長大なコンテキストとINT4量子化により、高い性能と効率性を両立させ、主要な推論ベンチマークで最先端の結果を示しています。
今日のHuggingFaceトレンド
briaai/FIBO
このリポジトリは、JSONネイティブな構造化キャプションで訓練された、初のオープンソースのテキスト・トゥ・イメージモデル「FIBO」のモデルウェイトを提供する。
FIBOは、従来のモデルにはない高い制御性、予測可能性、分離性を実現し、ライティング、構図、カメラ設定などを精密に指定できるプロフェッショナルなワークフロー向けの画像生成を可能にすることを目的としている。
briaai/FIBO
このリポジトリは、JSONネイティブな構造化キャプションで訓練された、初のオープンソースのテキスト・トゥ・イメージモデル「FIBO」のモデルウェイトを提供する。
FIBOは、従来のモデルにはない高い制御性、予測可能性、分離性を実現し、ライティング、構図、カメラ設定などを精密に指定できるプロフェッショナルなワークフロー向けの画像生成を可能にすることを目的としている。
briaai/FIBO · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
huggingface.co
November 8, 2025 at 10:16 AM
今日のHuggingFaceトレンド
briaai/FIBO
このリポジトリは、JSONネイティブな構造化キャプションで訓練された、初のオープンソースのテキスト・トゥ・イメージモデル「FIBO」のモデルウェイトを提供する。
FIBOは、従来のモデルにはない高い制御性、予測可能性、分離性を実現し、ライティング、構図、カメラ設定などを精密に指定できるプロフェッショナルなワークフロー向けの画像生成を可能にすることを目的としている。
briaai/FIBO
このリポジトリは、JSONネイティブな構造化キャプションで訓練された、初のオープンソースのテキスト・トゥ・イメージモデル「FIBO」のモデルウェイトを提供する。
FIBOは、従来のモデルにはない高い制御性、予測可能性、分離性を実現し、ライティング、構図、カメラ設定などを精密に指定できるプロフェッショナルなワークフロー向けの画像生成を可能にすることを目的としている。
今日のHuggingFaceトレンド
BAAI/Emu3.5
本リポジトリは、BAAIが開発した「Emu3.5」というネイティブな大規模マルチモーダルモデルを提供します。
これは、10兆トークン超のデータでエンドツーエンド学習され、視覚と言語を跨いだ統一的な世界モデリングと生成を実現します。
推論速度を約20倍に高速化するDiDA技術を採用し、多様な視覚言語生成タスクの実行を可能にすることを目的としています。
BAAI/Emu3.5
本リポジトリは、BAAIが開発した「Emu3.5」というネイティブな大規模マルチモーダルモデルを提供します。
これは、10兆トークン超のデータでエンドツーエンド学習され、視覚と言語を跨いだ統一的な世界モデリングと生成を実現します。
推論速度を約20倍に高速化するDiDA技術を採用し、多様な視覚言語生成タスクの実行を可能にすることを目的としています。
BAAI/Emu3.5 · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
huggingface.co
November 8, 2025 at 10:16 AM
今日のHuggingFaceトレンド
BAAI/Emu3.5
本リポジトリは、BAAIが開発した「Emu3.5」というネイティブな大規模マルチモーダルモデルを提供します。
これは、10兆トークン超のデータでエンドツーエンド学習され、視覚と言語を跨いだ統一的な世界モデリングと生成を実現します。
推論速度を約20倍に高速化するDiDA技術を採用し、多様な視覚言語生成タスクの実行を可能にすることを目的としています。
BAAI/Emu3.5
本リポジトリは、BAAIが開発した「Emu3.5」というネイティブな大規模マルチモーダルモデルを提供します。
これは、10兆トークン超のデータでエンドツーエンド学習され、視覚と言語を跨いだ統一的な世界モデリングと生成を実現します。
推論速度を約20倍に高速化するDiDA技術を採用し、多様な視覚言語生成タスクの実行を可能にすることを目的としています。
今日のHuggingFaceトレンド
moonshotai/Kimi-Linear-48B-A3B-Instruct
ハイブリッド線形注意アーキテクチャ「Kimi Linear」をオープンソース化し、特に長文脈タスクにおける大規模言語モデルの性能とハードウェア効率の向上を目指す。
本リポジトリは、Kimi Delta Attention (KDA)カーネルの実装と、最大1Mトークンの文脈長に対応した学習済みモデルチェックポイントを提供することで、従来のフルアテンション手法を上回る高速な推論とメモリ効率を実現する。
moonshotai/Kimi-Linear-48B-A3B-Instruct
ハイブリッド線形注意アーキテクチャ「Kimi Linear」をオープンソース化し、特に長文脈タスクにおける大規模言語モデルの性能とハードウェア効率の向上を目指す。
本リポジトリは、Kimi Delta Attention (KDA)カーネルの実装と、最大1Mトークンの文脈長に対応した学習済みモデルチェックポイントを提供することで、従来のフルアテンション手法を上回る高速な推論とメモリ効率を実現する。
moonshotai/Kimi-Linear-48B-A3B-Instruct · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
huggingface.co
November 8, 2025 at 10:16 AM
今日のHuggingFaceトレンド
moonshotai/Kimi-Linear-48B-A3B-Instruct
ハイブリッド線形注意アーキテクチャ「Kimi Linear」をオープンソース化し、特に長文脈タスクにおける大規模言語モデルの性能とハードウェア効率の向上を目指す。
本リポジトリは、Kimi Delta Attention (KDA)カーネルの実装と、最大1Mトークンの文脈長に対応した学習済みモデルチェックポイントを提供することで、従来のフルアテンション手法を上回る高速な推論とメモリ効率を実現する。
moonshotai/Kimi-Linear-48B-A3B-Instruct
ハイブリッド線形注意アーキテクチャ「Kimi Linear」をオープンソース化し、特に長文脈タスクにおける大規模言語モデルの性能とハードウェア効率の向上を目指す。
本リポジトリは、Kimi Delta Attention (KDA)カーネルの実装と、最大1Mトークンの文脈長に対応した学習済みモデルチェックポイントを提供することで、従来のフルアテンション手法を上回る高速な推論とメモリ効率を実現する。
今日のHuggingFaceトレンド
maya-research/maya1
このリポジトリは、豊かな感情表現と精密な音声設計を可能にするテキスト音声合成モデル「Maya1」を提供、紹介することを目的としている。
ユーザーは、自然言語による音声制御機能やインライン感情タグを活用し、声優に指示を出すように多様なキャラクターや感情を持つ音声をテキストから生成できる。
maya-research/maya1
このリポジトリは、豊かな感情表現と精密な音声設計を可能にするテキスト音声合成モデル「Maya1」を提供、紹介することを目的としている。
ユーザーは、自然言語による音声制御機能やインライン感情タグを活用し、声優に指示を出すように多様なキャラクターや感情を持つ音声をテキストから生成できる。
maya-research/maya1 · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
huggingface.co
November 8, 2025 at 10:16 AM
今日のHuggingFaceトレンド
maya-research/maya1
このリポジトリは、豊かな感情表現と精密な音声設計を可能にするテキスト音声合成モデル「Maya1」を提供、紹介することを目的としている。
ユーザーは、自然言語による音声制御機能やインライン感情タグを活用し、声優に指示を出すように多様なキャラクターや感情を持つ音声をテキストから生成できる。
maya-research/maya1
このリポジトリは、豊かな感情表現と精密な音声設計を可能にするテキスト音声合成モデル「Maya1」を提供、紹介することを目的としている。
ユーザーは、自然言語による音声制御機能やインライン感情タグを活用し、声優に指示を出すように多様なキャラクターや感情を持つ音声をテキストから生成できる。
今日のHuggingFaceトレンド
MiniMaxAI/MiniMax-M2
本リポジトリは、コーディングおよびエージェントワークフローのために設計されたオープンソースのMoEモデル「MiniMax-M2」を公開する。
MiniMax-M2は、合計2300億、アクティブ100億パラメータのコンパクトな設計ながら、高い汎用知能を持ち、マルチファイル編集や複雑なツール使用を含む高度な開発者およびエージェントタスクにおいて、効率性と優れた性能を提供することを目的としている。
MiniMaxAI/MiniMax-M2
本リポジトリは、コーディングおよびエージェントワークフローのために設計されたオープンソースのMoEモデル「MiniMax-M2」を公開する。
MiniMax-M2は、合計2300億、アクティブ100億パラメータのコンパクトな設計ながら、高い汎用知能を持ち、マルチファイル編集や複雑なツール使用を含む高度な開発者およびエージェントタスクにおいて、効率性と優れた性能を提供することを目的としている。
MiniMaxAI/MiniMax-M2 · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
huggingface.co
November 8, 2025 at 10:16 AM
今日のHuggingFaceトレンド
MiniMaxAI/MiniMax-M2
本リポジトリは、コーディングおよびエージェントワークフローのために設計されたオープンソースのMoEモデル「MiniMax-M2」を公開する。
MiniMax-M2は、合計2300億、アクティブ100億パラメータのコンパクトな設計ながら、高い汎用知能を持ち、マルチファイル編集や複雑なツール使用を含む高度な開発者およびエージェントタスクにおいて、効率性と優れた性能を提供することを目的としている。
MiniMaxAI/MiniMax-M2
本リポジトリは、コーディングおよびエージェントワークフローのために設計されたオープンソースのMoEモデル「MiniMax-M2」を公開する。
MiniMax-M2は、合計2300億、アクティブ100億パラメータのコンパクトな設計ながら、高い汎用知能を持ち、マルチファイル編集や複雑なツール使用を含む高度な開発者およびエージェントタスクにおいて、効率性と優れた性能を提供することを目的としている。
今日のHuggingFaceトレンド
Phr00t/Qwen-Image-Edit-Rapid-AIO
本リポジトリは、ComfyUI向けに、高速なQwen Image Editとテキスト画像生成を可能にするアクセラレータ、VAE、CLIPを統合したモデルを提供する。
本モデルはSFWとNSFWの両用途に対応したバージョンを分けて提供しており、特定のノードを使用することで入力画像を用いた編集機能も利用できる。
Phr00t/Qwen-Image-Edit-Rapid-AIO
本リポジトリは、ComfyUI向けに、高速なQwen Image Editとテキスト画像生成を可能にするアクセラレータ、VAE、CLIPを統合したモデルを提供する。
本モデルはSFWとNSFWの両用途に対応したバージョンを分けて提供しており、特定のノードを使用することで入力画像を用いた編集機能も利用できる。
Phr00t/Qwen-Image-Edit-Rapid-AIO · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
huggingface.co
November 7, 2025 at 10:19 AM
今日のHuggingFaceトレンド
Phr00t/Qwen-Image-Edit-Rapid-AIO
本リポジトリは、ComfyUI向けに、高速なQwen Image Editとテキスト画像生成を可能にするアクセラレータ、VAE、CLIPを統合したモデルを提供する。
本モデルはSFWとNSFWの両用途に対応したバージョンを分けて提供しており、特定のノードを使用することで入力画像を用いた編集機能も利用できる。
Phr00t/Qwen-Image-Edit-Rapid-AIO
本リポジトリは、ComfyUI向けに、高速なQwen Image Editとテキスト画像生成を可能にするアクセラレータ、VAE、CLIPを統合したモデルを提供する。
本モデルはSFWとNSFWの両用途に対応したバージョンを分けて提供しており、特定のノードを使用することで入力画像を用いた編集機能も利用できる。
今日のHuggingFaceトレンド
datalab-to/chandra
このリポジトリは、画像やPDFからの高精度なテキスト抽出とレイアウト情報の保持を実現し、結果をMarkdown、HTML、JSON形式で出力するOCRモデル「Chandra」を提供することが目的である。
CLIやウェブAPIを通じて利用可能であり、ベンチマークで高い性能を示す。
datalab-to/chandra
このリポジトリは、画像やPDFからの高精度なテキスト抽出とレイアウト情報の保持を実現し、結果をMarkdown、HTML、JSON形式で出力するOCRモデル「Chandra」を提供することが目的である。
CLIやウェブAPIを通じて利用可能であり、ベンチマークで高い性能を示す。
datalab-to/chandra · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
huggingface.co
November 7, 2025 at 10:19 AM
今日のHuggingFaceトレンド
datalab-to/chandra
このリポジトリは、画像やPDFからの高精度なテキスト抽出とレイアウト情報の保持を実現し、結果をMarkdown、HTML、JSON形式で出力するOCRモデル「Chandra」を提供することが目的である。
CLIやウェブAPIを通じて利用可能であり、ベンチマークで高い性能を示す。
datalab-to/chandra
このリポジトリは、画像やPDFからの高精度なテキスト抽出とレイアウト情報の保持を実現し、結果をMarkdown、HTML、JSON形式で出力するOCRモデル「Chandra」を提供することが目的である。
CLIやウェブAPIを通じて利用可能であり、ベンチマークで高い性能を示す。
今日のHuggingFaceトレンド
deepseek-ai/DeepSeek-OCR
このリポジトリは、DeepSeek-OCRモデルを用いて視覚テキスト圧縮(Contexts Optical Compression)を探求し、実現することを目的としています。
画像を入力とし、光学文字認識(OCR)やドキュメントのマークダウン変換などのタスクを実行します。
Hugging Face transformersライブラリを使用した推論コードを提供しており、vLLMによる推論高速化にも対応しています。
deepseek-ai/DeepSeek-OCR
このリポジトリは、DeepSeek-OCRモデルを用いて視覚テキスト圧縮(Contexts Optical Compression)を探求し、実現することを目的としています。
画像を入力とし、光学文字認識(OCR)やドキュメントのマークダウン変換などのタスクを実行します。
Hugging Face transformersライブラリを使用した推論コードを提供しており、vLLMによる推論高速化にも対応しています。
deepseek-ai/DeepSeek-OCR · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
huggingface.co
November 7, 2025 at 10:19 AM
今日のHuggingFaceトレンド
deepseek-ai/DeepSeek-OCR
このリポジトリは、DeepSeek-OCRモデルを用いて視覚テキスト圧縮(Contexts Optical Compression)を探求し、実現することを目的としています。
画像を入力とし、光学文字認識(OCR)やドキュメントのマークダウン変換などのタスクを実行します。
Hugging Face transformersライブラリを使用した推論コードを提供しており、vLLMによる推論高速化にも対応しています。
deepseek-ai/DeepSeek-OCR
このリポジトリは、DeepSeek-OCRモデルを用いて視覚テキスト圧縮(Contexts Optical Compression)を探求し、実現することを目的としています。
画像を入力とし、光学文字認識(OCR)やドキュメントのマークダウン変換などのタスクを実行します。
Hugging Face transformersライブラリを使用した推論コードを提供しており、vLLMによる推論高速化にも対応しています。
今日のHuggingFaceトレンド
dx8152/Qwen-Edit-2509-Multiple-angles
画像生成パイプラインで使用する、カメラワーク制御機能に特化したLoRAモデル「Qwen-Edit-2509」を提供すること。
このモデルは、プロンプトを通じてカメラの移動、回転、視点(俯瞰など)、画角(広角、特写)などを自在に制御可能とする。
モデルの安定性向上のための更新が行われ、他の指定されたLoRAとの併用が推奨されている。
dx8152/Qwen-Edit-2509-Multiple-angles
画像生成パイプラインで使用する、カメラワーク制御機能に特化したLoRAモデル「Qwen-Edit-2509」を提供すること。
このモデルは、プロンプトを通じてカメラの移動、回転、視点(俯瞰など)、画角(広角、特写)などを自在に制御可能とする。
モデルの安定性向上のための更新が行われ、他の指定されたLoRAとの併用が推奨されている。
dx8152/Qwen-Edit-2509-Multiple-angles · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
huggingface.co
November 7, 2025 at 10:19 AM
今日のHuggingFaceトレンド
dx8152/Qwen-Edit-2509-Multiple-angles
画像生成パイプラインで使用する、カメラワーク制御機能に特化したLoRAモデル「Qwen-Edit-2509」を提供すること。
このモデルは、プロンプトを通じてカメラの移動、回転、視点(俯瞰など)、画角(広角、特写)などを自在に制御可能とする。
モデルの安定性向上のための更新が行われ、他の指定されたLoRAとの併用が推奨されている。
dx8152/Qwen-Edit-2509-Multiple-angles
画像生成パイプラインで使用する、カメラワーク制御機能に特化したLoRAモデル「Qwen-Edit-2509」を提供すること。
このモデルは、プロンプトを通じてカメラの移動、回転、視点(俯瞰など)、画角(広角、特写)などを自在に制御可能とする。
モデルの安定性向上のための更新が行われ、他の指定されたLoRAとの併用が推奨されている。
今日のHuggingFaceトレンド
moonshotai/Kimi-K2-Thinking
強力なマルチステップ推論と安定したツール利用が可能なオープンソースの思考モデル「Kimi K2 Thinking」を提供する。
技術仕様(MoE、1Tパラメータ、256Kコンテキスト)とHLEなどの推論ベンチマーク結果を公開し、最先端の性能を示すことが目的である。
moonshotai/Kimi-K2-Thinking
強力なマルチステップ推論と安定したツール利用が可能なオープンソースの思考モデル「Kimi K2 Thinking」を提供する。
技術仕様(MoE、1Tパラメータ、256Kコンテキスト)とHLEなどの推論ベンチマーク結果を公開し、最先端の性能を示すことが目的である。
moonshotai/Kimi-K2-Thinking · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
huggingface.co
November 7, 2025 at 10:19 AM
今日のHuggingFaceトレンド
moonshotai/Kimi-K2-Thinking
強力なマルチステップ推論と安定したツール利用が可能なオープンソースの思考モデル「Kimi K2 Thinking」を提供する。
技術仕様(MoE、1Tパラメータ、256Kコンテキスト)とHLEなどの推論ベンチマーク結果を公開し、最先端の性能を示すことが目的である。
moonshotai/Kimi-K2-Thinking
強力なマルチステップ推論と安定したツール利用が可能なオープンソースの思考モデル「Kimi K2 Thinking」を提供する。
技術仕様(MoE、1Tパラメータ、256Kコンテキスト)とHLEなどの推論ベンチマーク結果を公開し、最先端の性能を示すことが目的である。
今日のHuggingFaceトレンド
BAAI/Emu3.5
BAAIが開発した大規模マルチモーダルモデル「Emu3.5」のモデル、コード、論文などの情報を提供することが目的である。
Emu3.5は、10兆以上のトークンで学習され、視覚と言語を統合した統一世界モデリングを実現する。
ネイティブなマルチモーダル入出力、強化学習による性能向上、DiDA技術による推論高速化が特徴であり、長尺の視覚・言語生成やany-to-image生成などの多様なタスクに対応する。
BAAI/Emu3.5
BAAIが開発した大規模マルチモーダルモデル「Emu3.5」のモデル、コード、論文などの情報を提供することが目的である。
Emu3.5は、10兆以上のトークンで学習され、視覚と言語を統合した統一世界モデリングを実現する。
ネイティブなマルチモーダル入出力、強化学習による性能向上、DiDA技術による推論高速化が特徴であり、長尺の視覚・言語生成やany-to-image生成などの多様なタスクに対応する。
BAAI/Emu3.5 · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
huggingface.co
November 6, 2025 at 10:20 AM
今日のHuggingFaceトレンド
BAAI/Emu3.5
BAAIが開発した大規模マルチモーダルモデル「Emu3.5」のモデル、コード、論文などの情報を提供することが目的である。
Emu3.5は、10兆以上のトークンで学習され、視覚と言語を統合した統一世界モデリングを実現する。
ネイティブなマルチモーダル入出力、強化学習による性能向上、DiDA技術による推論高速化が特徴であり、長尺の視覚・言語生成やany-to-image生成などの多様なタスクに対応する。
BAAI/Emu3.5
BAAIが開発した大規模マルチモーダルモデル「Emu3.5」のモデル、コード、論文などの情報を提供することが目的である。
Emu3.5は、10兆以上のトークンで学習され、視覚と言語を統合した統一世界モデリングを実現する。
ネイティブなマルチモーダル入出力、強化学習による性能向上、DiDA技術による推論高速化が特徴であり、長尺の視覚・言語生成やany-to-image生成などの多様なタスクに対応する。
今日のHuggingFaceトレンド
briaai/FIBO
本リポジトリは、プロフェッショナルなワークフロー向けに設計された、JSONネイティブなテキスト画像生成モデルFIBOを提供します。
FIBOは、長文の構造化キャプションに基づき、照明、構図、カメラ設定など、シーン要素を高い制御性と再現性をもって調整できることを目的としています。
briaai/FIBO
本リポジトリは、プロフェッショナルなワークフロー向けに設計された、JSONネイティブなテキスト画像生成モデルFIBOを提供します。
FIBOは、長文の構造化キャプションに基づき、照明、構図、カメラ設定など、シーン要素を高い制御性と再現性をもって調整できることを目的としています。
briaai/FIBO · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
huggingface.co
November 6, 2025 at 10:20 AM
今日のHuggingFaceトレンド
briaai/FIBO
本リポジトリは、プロフェッショナルなワークフロー向けに設計された、JSONネイティブなテキスト画像生成モデルFIBOを提供します。
FIBOは、長文の構造化キャプションに基づき、照明、構図、カメラ設定など、シーン要素を高い制御性と再現性をもって調整できることを目的としています。
briaai/FIBO
本リポジトリは、プロフェッショナルなワークフロー向けに設計された、JSONネイティブなテキスト画像生成モデルFIBOを提供します。
FIBOは、長文の構造化キャプションに基づき、照明、構図、カメラ設定など、シーン要素を高い制御性と再現性をもって調整できることを目的としています。
今日のHuggingFaceトレンド
maya-research/maya1
このリポジトリは、Maya Researchが開発したテキスト音声合成モデル「Maya1」に関するものである。
主な目的は、豊かな感情と正確な音声デザインを実現する表現力豊かな音声生成を提供することにある。
複雑な設定を排除し、自然言語による音声コントロールやインライン感情タグの使用を特徴とし、多様なキャラクターや感情(怒り、叫び、泣きなど)を持つ高品質な音声を生成するために作成された。
maya-research/maya1
このリポジトリは、Maya Researchが開発したテキスト音声合成モデル「Maya1」に関するものである。
主な目的は、豊かな感情と正確な音声デザインを実現する表現力豊かな音声生成を提供することにある。
複雑な設定を排除し、自然言語による音声コントロールやインライン感情タグの使用を特徴とし、多様なキャラクターや感情(怒り、叫び、泣きなど)を持つ高品質な音声を生成するために作成された。
maya-research/maya1 · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
huggingface.co
November 6, 2025 at 10:20 AM
今日のHuggingFaceトレンド
maya-research/maya1
このリポジトリは、Maya Researchが開発したテキスト音声合成モデル「Maya1」に関するものである。
主な目的は、豊かな感情と正確な音声デザインを実現する表現力豊かな音声生成を提供することにある。
複雑な設定を排除し、自然言語による音声コントロールやインライン感情タグの使用を特徴とし、多様なキャラクターや感情(怒り、叫び、泣きなど)を持つ高品質な音声を生成するために作成された。
maya-research/maya1
このリポジトリは、Maya Researchが開発したテキスト音声合成モデル「Maya1」に関するものである。
主な目的は、豊かな感情と正確な音声デザインを実現する表現力豊かな音声生成を提供することにある。
複雑な設定を排除し、自然言語による音声コントロールやインライン感情タグの使用を特徴とし、多様なキャラクターや感情(怒り、叫び、泣きなど)を持つ高品質な音声を生成するために作成された。
今日のHuggingFaceトレンド
MiniMaxAI/MiniMax-M2
このリポジトリは、コーディングおよびエージェントワークフローに特化して設計された、MiniMax-M2という効率的で高性能な大規模言語モデル(MoE)を公開・オープンソース化するために作成されました。
本モデルは、100億のアクティブパラメータを持つコンパクトな設計でありながら、高度な一般知能、マルチファイル編集を含む優れたコーディング能力、複雑なツールチェーンを実行するエージェント性能を提供し、効率的な開発とスケーリングを実現することを目的としています。
MiniMaxAI/MiniMax-M2
このリポジトリは、コーディングおよびエージェントワークフローに特化して設計された、MiniMax-M2という効率的で高性能な大規模言語モデル(MoE)を公開・オープンソース化するために作成されました。
本モデルは、100億のアクティブパラメータを持つコンパクトな設計でありながら、高度な一般知能、マルチファイル編集を含む優れたコーディング能力、複雑なツールチェーンを実行するエージェント性能を提供し、効率的な開発とスケーリングを実現することを目的としています。
MiniMaxAI/MiniMax-M2 · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
huggingface.co
November 6, 2025 at 10:20 AM
今日のHuggingFaceトレンド
MiniMaxAI/MiniMax-M2
このリポジトリは、コーディングおよびエージェントワークフローに特化して設計された、MiniMax-M2という効率的で高性能な大規模言語モデル(MoE)を公開・オープンソース化するために作成されました。
本モデルは、100億のアクティブパラメータを持つコンパクトな設計でありながら、高度な一般知能、マルチファイル編集を含む優れたコーディング能力、複雑なツールチェーンを実行するエージェント性能を提供し、効率的な開発とスケーリングを実現することを目的としています。
MiniMaxAI/MiniMax-M2
このリポジトリは、コーディングおよびエージェントワークフローに特化して設計された、MiniMax-M2という効率的で高性能な大規模言語モデル(MoE)を公開・オープンソース化するために作成されました。
本モデルは、100億のアクティブパラメータを持つコンパクトな設計でありながら、高度な一般知能、マルチファイル編集を含む優れたコーディング能力、複雑なツールチェーンを実行するエージェント性能を提供し、効率的な開発とスケーリングを実現することを目的としています。
今日のHuggingFaceトレンド
moonshotai/Kimi-Linear-48B-A3B-Instruct
長文コンテキスト処理に特化したハイブリッド線形注意アーキテクチャ「Kimi Linear」を公開する。
これは、Kimi Delta Attention (KDA)を核とし、従来のフルアテンションを性能と効率で上回る。
最大1Mトークンに対応し、KVキャッシュ削減やデコーディング速度の向上を実現するKDAカーネルと学習済みモデルチェックポイントを提供する。
moonshotai/Kimi-Linear-48B-A3B-Instruct
長文コンテキスト処理に特化したハイブリッド線形注意アーキテクチャ「Kimi Linear」を公開する。
これは、Kimi Delta Attention (KDA)を核とし、従来のフルアテンションを性能と効率で上回る。
最大1Mトークンに対応し、KVキャッシュ削減やデコーディング速度の向上を実現するKDAカーネルと学習済みモデルチェックポイントを提供する。
moonshotai/Kimi-Linear-48B-A3B-Instruct · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
huggingface.co
November 6, 2025 at 10:19 AM
今日のHuggingFaceトレンド
moonshotai/Kimi-Linear-48B-A3B-Instruct
長文コンテキスト処理に特化したハイブリッド線形注意アーキテクチャ「Kimi Linear」を公開する。
これは、Kimi Delta Attention (KDA)を核とし、従来のフルアテンションを性能と効率で上回る。
最大1Mトークンに対応し、KVキャッシュ削減やデコーディング速度の向上を実現するKDAカーネルと学習済みモデルチェックポイントを提供する。
moonshotai/Kimi-Linear-48B-A3B-Instruct
長文コンテキスト処理に特化したハイブリッド線形注意アーキテクチャ「Kimi Linear」を公開する。
これは、Kimi Delta Attention (KDA)を核とし、従来のフルアテンションを性能と効率で上回る。
最大1Mトークンに対応し、KVキャッシュ削減やデコーディング速度の向上を実現するKDAカーネルと学習済みモデルチェックポイントを提供する。