跳转至

概览

 
AI工程化开源组织

目标

致力于搭建AI模型从学术界到工程界之间的桥梁,解决AI模型应用的最后一公里。

我们是做什么的?

  • 主要围绕人工智能相关的技术展开,包括计算机视觉、自然语言处理和语音。当然不仅仅限于这三个方向,会紧跟技术工程化前沿。
  • 侧重工程化落地,不训练模型(当然有训练模型的能力),但是可以更好地在工程中应用落地。
  • 主打简洁有效、开箱即用的使用和部署方案,目的是极大降低使用门槛。

明星项目

🤖 LLM

🏗️Project ⭐️Stars 📝Description
LLM-DOC GitHub Repo stars 大模型研究院资料馆
LLM-EXAM GitHub Repo stars 大模型中文测试题库-民间版本

🔍💬 RAG相关

🏗️Project ⭐️Stars 📝Description
Knowledge-QA-LLM GitHub Repo stars QA based on local knowledge and LLM.

⚙ OCR推理部署

Program Language 🏗️Project ⭐️Stars 📝Description
Python 🔥RapidOCR GitHub Repo stars Awesome OCR multiple programing languages toolkits based on ONNXRuntime, OpenVION and PaddlePaddle. (将PaddleOCR模型做了转换,采用ONNXRuntime推理,速度很快)
C++ RapidOcrOnnx GitHub Repo stars rapidocr onnx cpp
C++ RapidOcrNcnn GitHub Repo stars RapidOCR ncnn 推理
Java RapidOcr—Java GitHub Repo stars Java代码实现调用RapidOCR(基于PaddleOCR),适配Mac、Win、Linux,支持最新PP-OCRv4
Java RapidOcrOnnxJvm GitHub Repo stars RapidOcr onnx java kotlin jni test
Java RapidOcrNcnnJvm GitHub Repo stars RapidOcr ncnn java kotlin jni
C# RapidOCRCSharp GitHub Repo stars 本项目为Windows平台C# WinForm范例
Android RapidOcrAndroidOnnx GitHub Repo stars RapidOcr onnxruntime推理 for Android
Android RapidOcrAndroidOnnxCompose GitHub Repo stars opencv onnxruntime ocr android demo, jetpack compose + kotlin
易语言 RapidOCRServer GitHub Repo stars RapidOCR HTTP 服务。win32程序,易语言编写

📄 智能文档

🏗️Project ⭐️Stars 📝Description
RapidTableDetection GitHub Repo stars 检测和提取各种场景图片中的表格区域,并纠正透视和旋转问题 Detect and extract table regions from images in various scenarios, and correct perspective and rotation issues.
RapidUnWrap GitHub Repo stars 修正文档扭曲,使用onnx模型简单轻量部署,未来持续跟进最新最好的文档矫正方案和模型,Correct document distortion using a lightweight ONNX model for easy deployment. We will continue to follow and integrate the latest and best document correction solutions and models in the future.
🔥RapidDoc GitHub Repo stars 针对文档类图像做内容提取,将文档类图像一比一输出到Word或者Txt中,便于进一步使用或处理。后续计划支持输入PDF/图像,输出对应json格式、Txt格式、Word格式和Markdown格式。
RapidOrientation GitHub Repo stars 文档方向分类
RapidLaTexOCR GitHub Repo stars 公式识别:Formula recognition based on LaTeX-OCR and ONNXRuntime.
RapidTable GitHub Repo stars 源自PP-Structure的表格识别算法,模型转换为ONNX,推理引擎采用ONNXRuntime,部署简单,无内存泄露问题。
TableStructureRec GitHub Repo stars 整理目前开源的最优表格识别模型,完善前后处理,模型转换为ONNX
RapidLayout GitHub Repo stars Analysis of Chinese and English layouts 中英文版面分析
RapidOCRPDF GitHub Repo stars PDF提取: Based on RapidOCR, extract the PDF content.
ExtractOfficeContent GitHub Repo stars Office内容提取

🎶 语音相关

🏗️Project ⭐️Stars 📝Description
RapidASR GitHub Repo stars 商用级开源语音自动识别程序库,开箱即用,全平台支持,中英文混合识别。A Cross-platform implementation of ASR inference. It's based on ONNXRuntime and FunASR. We provide a set of easier APIs to call ASR models.
RapidTTS GitHub Repo stars A cross platform implementation of Text-to-Speech based on ONNXRuntime.
RapidVoice GitHub Repo stars The engineering implementation of SenseVoice (from Alibaba)
RapidPunc GitHub Repo stars A library for adding punctuation into a text from ASR.
paraformer_simple GitHub Repo stars paraformer 语音识别模型的简化推理代码
RapidAudioKit GitHub Repo stars It's for the repository of audio resampling tools
RapidVAD GitHub Repo stars A library for splitting audio for ASR.
RapidTP-Aligns GitHub Repo stars 语音的时间戳预测

👷‍♂️🛠️ Builder

🏗️Project ⭐️Stars 📝Description
OnnxruntimeBuilder GitHub Repo stars Onnxruntime Builder
OpenCVBuilder GitHub Repo stars OpenCV Custom Builder

🔄 转换工具

🏗️Project ⭐️Stars 📝Description
PaddleOCRModelConvert GitHub Repo stars PaddleOCR模型转换工具
LabelConvert GitHub Repo stars 目标检测数据集格式转换

🏷 评测工具

🏗️Project ⭐️Stars 📝Description
TextDetMetric GitHub Repo stars 计算文本检测算法评测指标
TableRecognitionMetric GitHub Repo stars 计算表格识别算法评测指标

📱 场景应用

🏗️Project ⭐️Stars 📝Description
RapidVideOCR GitHub Repo stars 视频硬字幕提取工具

🔢 测评集

🏗️Project 📝Description
text_det_test_dataset 文本测试集
text_rec_test_dataset 文本识别测试集
table_rec_test_dataset 表格识别测试集

All Repositories

评论