沫沫
test7855.bsky.social
沫沫
@test7855.bsky.social
分享有趣的 GitHub 專案
#開源分享 一款可用於理解超長影片的RAG框架:VideoRAG,可以處理數百小時的影片內容,可以同時理解多個影片

支持數百小時的影片輸入,可以同時分析多個影片

高效率的知識索引,可將數百小時的影片提煉成結構化的知識圖譜,理解影片內容間的關聯,提供準確回復

多模態處理,可結合視覺內容和文本語義進行分析理解,支持基於影片內容的智慧問答

專案地址: github.com/HKUDS/VideoRAG

#RAG #影片RAG #VideoRAG
February 8, 2025 at 11:25 AM
#開源分享 一份最新準確的中國節假日補班日曆:china-holiday-calender。

包含了 2023-2025 年中國節假日、調休、補班日曆,提供 ICS 格式,可通過 API 獲取。

專案地址: github.com/lanceliao/china-holiday-calender

支持 iPhone、Google Calendar、Outlook 等用戶端訂閱。

節假日資訊來自官方,一手資訊、權威準確,沒有廣告。

#chinaholidaycalender #節假日 #日曆
February 2, 2025 at 11:46 AM
#開源分享 一款開源免費的安卓電視直播軟體:mytv-android。

內建了直播源,直接安裝即可使用,具有穩定、快速、免費和無廣告等特點。

專案地址: github.com/sakana164/mytv-android

注意:僅支持安卓 5.0 及以上作業系統。

#mytvandroid #電視直播
February 2, 2025 at 11:45 AM
#開源分享 一款跨平台影片下載工具:Lux。

基於 Go 語言開發,支持幾乎所有影片平台,如抖音、B 站、YouTube、Twitter、騰訊、愛奇藝等等。

專案地址: github.com/iawia002/lux

並提供了包括 macOS、Windows、Linux 等平台的命令行支持。

另外,還可透過參數來控制下載影片的格式、清晰度、字幕等。

#Lux #影片下載
January 29, 2025 at 11:01 AM
#開源分享 一款好用的資源偵測下載工具:res-downloader。

支持影片、圖片、音訊、m3u8、直播流等網路資源,甚至還可以支持獲取特殊網路下的資源。

專案地址: github.com/putyy/res-downloader

而且支持了中國大部分主流平台,如影片號、小紅書、抖音、快手、酷狗、QQ 等等。

提供 Windows、macOS 和 Linux 安裝包使用。

#resdownloader #資源下載
January 23, 2025 at 12:18 PM
#開源分享 一個可自動錄製中國各個直播平台的開源工具: Stream-rec。

支持自動錄播,可自訂錄製質量、路徑、格式、時間等等配置選項,以及還支持錄製彈幕。

專案地址: github.com/stream-rec/stream-rec

提供可視化界面操作,可持久化儲存錄播和上傳資訊,同步到雲端儲存。

支持抖音、虎牙、鬥魚、Twitch、微博等主流平台。

#Streamrec #直播
January 23, 2025 at 12:18 PM
#開源分享 阿里巴巴開源了一款可用於複雜任務、能自我進化的行動裝置智慧助手:Mobile-Agent-E,它能完成手機上複雜的多步驟任務,比如訂餐、尋找資訊等等

它是一個分層多智慧體框架,一個管理器和四個下級代理,感知器、操作器、動作反射器和記錄器共五個智慧體,可以通過經驗自我進化

支持超長任務鏈,可以跨應用操作

具備錯誤處理機制,可以自我檢查錯誤,持續最佳化性能

專案地址: github.com/X-PLUG/MobileAgent/tree/main/Mobile-Agent-E

#AI移動助手 #MobileAgentE #MobileAgent
January 22, 2025 at 11:25 AM
#開源分享 阿里巴巴開源的一個新聞時間線摘要生成系統:CHRONOS,給它一個話題,它能生成一份按時間順序整理好的重要事件摘要

具備疊代式自我提問機制,可以自己提問,自動找答案,按時間順序整理重要資訊

支持開放域新聞時間線生成,不限特定領域

處理速度快,可以處理大量新聞

專案地址: github.com/Alibaba-NLP/CHRONOS

#新聞助手 #新聞事件整理助手 #CHRONOS
January 22, 2025 at 11:25 AM
#開源分享 一個銀行客服聊天機器人的範例項目,基於RAG+
LangChain構建,可以回答FAQ常見問題、處理密碼重設流程、匯率查詢諮詢

有完整的範例代碼和安裝說明,適合學習和二次開發

專案地址: github.com/multinear-demo/demo-bank-support-lc-py

#銀行客服機器人
January 20, 2025 at 2:38 PM
#開源分享 一款很不錯的AI筆記助手:NoteGen,它提供了強大的紀錄功能,能快速捕捉和整理碎片化知識,將記錄內容整理成一篇筆記

寫作工具內建Markdown編輯器,支持列表大綱、數學公式、圖表、流程圖、甘特圖、時序圖、五線譜等

支持AI機器人對話,可以詢問它與記錄有關的問題,它輸出的內容也可以作為記錄保存下來

支持截圖、插圖以及文本多種記錄方式,截圖的話先OCR 識別圖片中的文字,再用ChatGPT進行總結

使用整理功能,自動可以把所有記錄整理成一篇可讀的筆記

專案地址: github.com/codexu/note-gen

#AI筆記 #NoteGen #文件自動整理總結工具
January 20, 2025 at 2:38 PM
#開源分享 基於LangChain和Gemini AI構建的一個具有記憶功能的聊天機器人教學,適合需要長期記憶功能的應用場景

教學地址: cckeh.hashnode.dev/building-chatbots-with-memory-capabilities-a-comprehensive-tutorial-with-langchain-langgraph-gemini-ai-and-mongodb
專案地址: github.com/CC-KEH/GenAI-Tutorials/blob/main/langchain_chatbot_with_memory.py
January 18, 2025 at 11:12 AM
#開源分享 一款輔助閱讀和理解科研論文的AI工具,一個科研助手:OpenScholar

它可以基於提問自動尋找相關的論文,並把論文內容消化後用通俗易懂的方式回,且會標註資訊來源,解決每年新發表的論文太多看不過來的問題

專業工具,專門理解和處理專業學術內容

支持標準RAG流程,包含檢索器+重排序器管道,具備自反思生成能力

專案地址: github.com/AkariAsai/OpenScholar

#RAG #論文閱讀工具 #OpenScholar
January 18, 2025 at 11:11 AM
開源分享 一款專門用於將HTML轉為Markdown和JSON格式的小模型

1、可以處理長文本,支援複雜格式,比如表格、嵌套列表、LaTeX公式等

2、穩定性比較好,沒有重複或循環的問題

3、支援 29種語言,包括英語、中文、日語、韓語、法語、西班牙語、葡萄牙語、德語、義大利語、俄語、越南語、泰語、阿拉伯語等

適合需要批次處理網頁或自動化網頁資料提取的場景

模型: huggingface.co/jinaai/ReaderLM-v2

#網頁轉Markdown #網頁轉JSON #ReaderLMv2
January 17, 2025 at 11:23 AM
#開源分享 一款適合小模型的輕量級RAG系統:MiniRAG,性能與基於LLM方法的相當,但僅需25%的儲存空間

準確性和錯誤率上超過了現有的輕量級系統
在複雜查詢任務上表現相對較好

夠用省資源,適合在設備上使用

MiniRAG的兩個關鍵,讓小模型取得良好的RAG效果
(1)語義感知的異構圖索引機制,將文本塊和命名實體結合在一個統一結構中,減少了對複雜語義理解的依賴
(2)輕量級的拓撲增強檢索方法,利用圖結構實現高效的知識發現,無需高級語言能力

專案地址: github.com/HKUDS/MiniRAG

#RAG #小模型RAG #MiniRAG
January 17, 2025 at 11:22 AM
#開源分享 AI文章檢測工具:ImBD,可以檢測文章是否被AI修改過,能檢測純AI生成的,還能檢測被AI潤色、改寫、擴寫的,準確率高

用來檢測論文、稿件原創性就非常輕鬆,它僅使用1000個樣本和5分鐘的SPO訓練就超過了商業的GPT-Zero

檢測開源LLM修改文本上提高了13%,檢測GPT-3.5和GPT-4o修改的文本上,性能提高了5%和19%

支持像改寫、擴寫、潤色都可以,純AI生成的檢測率能到99.96%,改寫87.39%,擴寫97.58%,潤色97.07%

專案地址: github.com/Jiaqi-Chen-00/ImBD

#AI文章檢測 #論文檢測工具 #ImBD
January 8, 2025 at 11:22 AM
#開源分享 一個書籍生成的AI項目:ai-book-writer,根據給定的初始提示,實現寫作自動化

該系統採用多個專門的代理協同工作,完成從初始提示創建連貫結構化的敘述

專案地址: github.com/adamwlarson/ai-book-writer

#agent #aibookwriter
January 8, 2025 at 11:18 AM
#開源分享 一個書籍生成的AI項目:ai-book-writer,根據給定的初始提示,實現寫作自動化

該系統採用多個專門的代理協同工作,完成從初始提示創建連貫結構化的敘述

專案地址: github.com/adamwlarson/ai-book-writer

#agent #aibookwriter
January 8, 2025 at 11:18 AM
#開源分享 虛擬化妝項目:SHMT,可以把一個人的妝容遷移到另一個人的臉上,妝容細節保持度比較高,用於電商線上試妝應該很不錯

它用分層處理方式將化妝過程分解成多個層次,底妝、眼妝、唇妝等, 能精細控制每個化妝步驟,使效果逼真自然

採用自監督學習的方式進行訓練,無需大量標註數據

能在保留源圖像比如臉部結構、表情等的同時,準確遷移參考妝容

專案地址: github.com/Snowfallingplum/SHMT

#虛擬化妝 #SHMT #AI化妝
January 5, 2025 at 12:24 PM
#開源分享 字節跳動和中國清華的一款多服裝虛擬試穿項目:AnyDressing,它支持同時試穿多件衣服,能處理複雜服裝組合,看起來細節保持和衣服貼合度比較好

1、比如試穿上衣+褲子+外套,一次性完成,可訂製性強, 能夠處理多種服裝組合和個性化文本提示

2、適用於各種場景,支持現實風格生成也支持動漫風

3、可以和其他AI工具配合使用(ControlNet, LoRA等),支持文字描述來調整生成效果,比如調整衣服的風格、人物表情等等

專案地址: github.com/Crayon-Shinchan/AnyDressing

#虛擬試衣 #多服裝虛擬試穿 #AnyDressing
January 5, 2025 at 12:21 PM
#開源分享 一個優雅地閱讀即時熱門新聞的開源工具:NewsNow。

劃分為中國、國際、科技、財經幾大類,涵蓋了微博、知乎、抖音、GitHub、華爾街、Hacker News、V2EX 等主流平台。

專案地址:github.com/ourongxing/newsnow

可一鍵部署到 Cloudflare Pages、Vercel 等平台使用。

#閱讀 #rss
January 5, 2025 at 12:18 PM
#開源分享 一款影片字幕AI工具:ai-no-jimaku-gumi,自動將影片轉換成字幕並翻譯成多種語言

從影片音訊中提取語音自動生成字幕
支持包括但不限於英語、日語、中文等多語言翻譯
目前主要支持SRT字幕格式輸出
支持自訂參數

專案地址: github.com/Inokinoki/ai-no-jimaku-gumi

#AI字幕工具
January 5, 2025 at 12:15 PM