概览
AI工程化开源组织
目标
致力于搭建AI模型从学术界到工程界之间的桥梁,解决AI模型应用的最后一公里。
我们是做什么的?
主要围绕人工智能相关的技术展开,包括计算机视觉、自然语言处理和语音。当然不仅仅限于这三个方向,会紧跟技术工程化前沿。
侧重工程化落地,不训练模型(当然有训练模型的能力),但是可以更好地在工程中应用落地。
主打简洁有效、开箱即用的使用和部署方案,目的是极大降低使用门槛。
明星项目
🤖 LLM
🔍💬 RAG相关
🏗️Project
⭐️Stars
📝Description
Knowledge-QA-LLM
QA based on local knowledge and LLM.
⚙ OCR推理部署
📄 智能文档
🏗️Project
⭐️Stars
📝Description
RapidTableDetection
检测和提取各种场景图片中的表格区域,并纠正透视和旋转问题 Detect and extract table regions from images in various scenarios, and correct perspective and rotation issues.
RapidUnWrap
修正文档扭曲,使用onnx模型简单轻量部署,未来持续跟进最新最好的文档矫正方案和模型,Correct document distortion using a lightweight ONNX model for easy deployment. We will continue to follow and integrate the latest and best document correction solutions and models in the future.
🔥RapidDoc
针对文档类图像做内容提取,将文档类图像一比一输出到Word或者Txt中,便于进一步使用或处理。后续计划支持输入PDF/图像,输出对应json格式、Txt格式、Word格式和Markdown格式。
RapidOrientation
文档方向分类
RapidLaTexOCR
公式识别:Formula recognition based on LaTeX-OCR and ONNXRuntime.
RapidTable
源自PP-Structure的表格识别算法,模型转换为ONNX,推理引擎采用ONNXRuntime,部署简单,无内存泄露问题。
TableStructureRec
整理目前开源的最优表格识别模型,完善前后处理,模型转换为ONNX
RapidLayout
Analysis of Chinese and English layouts 中英文版面分析
RapidOCRPDF
PDF提取: Based on RapidOCR, extract the PDF content.
ExtractOfficeContent
Office内容提取
🎶 语音相关
🏗️Project
⭐️Stars
📝Description
RapidASR
商用级开源语音自动识别程序库,开箱即用,全平台支持,中英文混合识别。A Cross-platform implementation of ASR inference. It's based on ONNXRuntime and FunASR. We provide a set of easier APIs to call ASR models.
RapidTTS
A cross platform implementation of Text-to-Speech based on ONNXRuntime.
RapidVoice
The engineering implementation of SenseVoice (from Alibaba)
RapidPunc
A library for adding punctuation into a text from ASR.
paraformer_simple
paraformer 语音识别模型的简化推理代码
RapidAudioKit
It's for the repository of audio resampling tools
RapidVAD
A library for splitting audio for ASR.
RapidTP-Aligns
语音的时间戳预测
👷♂️🛠️ Builder
🔄 转换工具
🏷 评测工具
📱 场景应用
🔢 测评集
2024年11月18日
2024年11月18日
GitHub