OCR асистент за разпознаване на текст

Ръководство за разработка на Open API интерфейс

Вземете API кредити

Добре дошли в OCR Text Recognition Assistant Open Platform!
Предлагаме стабилни, високоскоростни, готови услуги за извличане на текст и разпознаване на таблици.

1. Глобален механизъм за автентикация (Auth)

Всички заявки за интерфейс трябва да включват следните параметри за удостоверяване в URL адреса:

Име на параметъра Задължително Описание
app е Фиксирана стойност api
token е Можеш да го намериш в Личен център Вземи си свой собствен жетон
2. Идентифициране на основния интерфейс (op = код)

Заявка URL: /Code.ashx?op=code&app=api&token=YOUR_TOKEN&type=0

Метод на извикване: POST

Параметрите са еднородно изписани в URL адреса, а данните от изображението се предават през тялото на POST (поддържа се многокомпонентна функция поток на файла, поле на форма или обикновен текст).

2.1 Въведете изображението, което ще бъде разпознато (изберете едно от трите)

Име на параметъра Тип Описание
(Документ) File Стандартен многокомпонентен поток за качване на файлове.
url String Публичната мрежа на снимката може да получи достъп до директния адрес на връзката.
code String Base64 низ на изображението (не е необходимо да се включва декларация за форматиране на заглавието).

2.2 Основен режим и управление на двигателя

Име на параметъра Задължително Описание
type Не Идентифицирайте модели:
0: Разпознаване на текст (По подразбиране)
1: Вертикална идентификация
2: Разпознаване на таблици
3: Разпознаване на формули (Като например MathPix)

2.3 Правила за форматиране и оформление (по избор)

Следните параметри предават стойности 1 Включи съответната обработка, стойност 0 Не е включено.
Ако няма конкретна необходимост, се препоръчва да не се предава и да се остави на системата да реши:

Име на параметъра Задължително Описание
left Не Биография 1 Принудително сортирайте шевове отляво надясно.
top Не Биография 1 Принудително сортиране отгоре надолу.
autodirection Не Биография 1 Автоматично определя ориентацията на изображението и го завърта, за да се подравни.
half Не Биография 1 Автоматична пунктуация по пълна ширина до обикновена половинна ширина.
space Не Биография 1 Автоматично обработва интервалите между английски и китайски, японски и корейски знаци.
symbol Не Биография 1 Автоматично коригирай странната пунктуация.
duplicate Не Биография 1 Автоматично премахвайте тиретата.

2.4 Описание на връщаната стойност (JSON)

Интерфейсът за разпознаване връща стандартен JSON формат. Стойността е null полето се пропуска автоматично.

Полета на най-високо ниво

Поле Тип Описание
id String Уникалният batch ID (UUID формат) на тази заявка може да се използва за асинхронно заявяване на резултатите.
ocrType Int Идентифицирайте типа с параметрите на заявката type кореспонденция.
processId Int ID-то на възела на двигателя, който обработи заявката.
processName String Имена на процесни двигатели. Когато е празно, означава, че разпознаването е изтекло или не е било присвоено на възел.
state Int Обработвайте статусните кодове (вижте таблицата с изброяване по-долу).
message String Допълнително описание на съобщение/грешка, което се връща само в изключителни случаи.
result Object Обекти за резултати за идентификация на ядрото (вижте таблицата с подполета по-долу за подробности).
desc String Допълнителна описателна информация, свързана с двигателя, ако има такава.

result Подобект – Текстов резултат

Поле Тип Описание
autoText String Препоръчителна употреба。 Пълен текст с интелигентно сливане на параграфи и оптимизация на оформлението.
spiltText String Текстът е разделен по оригинален параграф (между параграфите) \t Отстъп + \n Прекъсване на линия). В табичен режим данните са JSON колони.
transText String Преведете получения текст (само в type=Превод режим се връща, структура с spiltText кореспонденция).
lang String Идентификаторът на езика на изображенията се открива автоматично от двигателя (например chi_sim, eng, jpn)。
resultType Int Тип формат на резултата.0= обикновен текст, 1= уеб страница (с формулно рендериране), 2= Таблица.

result Подобект - данни 🗺️ за позициониране на координати

Следващите полета съдържат точната позиция на всеки текстов блок върху оригиналното изображение, подходяща за сценарии като подчертаване на наслагвания, извличане на области и др.

Поле Тип Описание
spiltLocText String Оригинален сегментиран текст с координатна информация (резултат от смарт сливане на параграфи, включително информация за местоположението).
transLocText String Преведени сегментирани тексти с координатна информация.
verticalText String (JSON) ⭐ JSON низ от пълен текстов блоков координатен масив. По един за всеки елемент TextCellInfo обект (виж структурата по-долу).

verticalText Структура на обекта TextCellInfo

[
  {
    "words": "Текстовото съдържание, което се разпознава",
    "trans": "Резултати от превода (ако има такива)",
    "pageIndex": 0,
    "location": {
      "left": 120.0,
      "top": 45.0,
      "width": 230.0,
      "height": 28.0
    }
  },
  ...
]
Поле Тип Описание
words String Текстът, разпознат от този текстов блок.
trans String Резултати от превод (ценят се само в режим на превод).
pageIndex Int Индекс на номер на страница (валиден в многостранични документи, започващ от 0).
location.left Double X координати (пиксели) се намира в горния ляв ъгъл на текстовия блок.
location.top Double Y координатата (пикселите) е в горния ляв ъгъл на текстовия блок.
location.width Double Ширина на текстовия блок (в пиксели).
location.height Double Височина на текстовия блок (в пиксели).

result Подобект - Изтегляне на файлове

Поле Тип Описание
viewUrl String Когато resultType=1 (уебстраница/формула), адресът на онлайн страницата за преглед е върнат.
downloadHtml String HTML откъс с линкове за изтегляне.
files Array Списък с файлове с резултати, достъпни за изтегляне, всеки от които е: DownLoadInfo обект (виж структурата по-долу).

files Структурата на обекта DownLoadInfo в структурата на обекта DownLoadInfo

Поле Тип Описание
url String Адресът за изтегляне на файла.
param String Изтеглете допълнителните параметри, които ви трябват.
fileType Int Изброяване на типове файлове:1=PDF, 2=Word, 3=PPT, 4=Excel, 5=TXT, 6=Markdown
desc String Описание на документа.

state Изброяване на щатите

Стойност Значение Описание
0 В процес на изчакване Заявката е получена, но локомотивът все още не е назначен.
2 Успешна обработка Разпознаването на връщане се получава нормално.
3 Обработката се провали Двигателят се справя с изключение и може да бъде изпробван отново.
4 Време за обработка Двигателят не се върна в рамките на срока на валидност.
6 Лимит на паралелност Има твърде много едновременни заявки, затова моля, намалете честотата.
7 Типове не се поддържат Текущият тип разпознаване или формат на файла не се поддържа.

Пример от задната страна

✅ Успешен отговор (с координатни данни):

{
  "ocrType": 0,
  "id": "a1b2c3d4-e5f6-7890-abcd-ef1234567890",
  "processId": 3,
  "processName": "OCR-Node-01",
  "state": 2,
  "result": {
    "autoText": "Пълен текст след умно сливане",
    "spiltText": "Оригиналният текст, разделен на параграфи",
    "verticalText": "[{\"words\":\"Здравейте\",\"location\":{\"left\":10,\"top\":20,\"width\":80,\"height\":22}}]",
    "resultType": 0,
    "lang": "chi_sim"
  }
}

❌ Отговор за грешка/ограничение:

{
  "ocrType": 0,
  "processName": "Съвети",
  "result": {
    "spiltText": "Днешната квота за API е изчерпана, моля, презаредете се и продължете да я използвате!",
    "autoText": "Днешната квота за API е изчерпана, моля, презаредете се и продължете да я използвате!"
  },
  "id": 1
}
3. Асинхронна заявка за резултати (op = idcode)

Заявка URL: /Code.ashx?op=idcode&app=api&token=YOUR_TOKEN

Метод на извикване: POST

Функция: Върнато според интерфейса за разпознаване id Заявете резултатите от асинхронна обработка. Когато интерфейсът за разпознаване се върне state=0(в очакване), можете да използвате този интерфейс, за да проведете анкета и да получите крайния резултат.

Име на параметъра Задължително Тип Описание
id е String Идентифицирайте пакетния ID на заявката, върнат от интерфейса, и го предайте през тялото на POST.

Пример от задната страна

✅ Успешен отговор:

[
  {
    "ocrType": 0,
    "id": "a1b2c3d4-...",
    "processName": "OCR-Node-01",
    "state": 2,
    "result": {
      "autoText": "Идентифицирайте получения текст",
      "spiltText": "Сегментиран текст",
      "resultType": 0
    }
  }
]

❌ Неуспешен отговор (ID не съществува или резултатът е изтекъл):

no

Връща обикновен текст no Показва, че не е намерен резултат за този ID, който може да е ID Грешката или резултатът са изтекли и се изчистват.

4. Легло за качване на изображения (op = imgUpload)

Заявка URL: /Code.ashx?op=imgUpload&app=api&token=YOUR_TOKEN

Метод на извикване: POST (multipart/form-data)

Функция: Качете изображение в безплатното легло с изображения и върнете директен URL на връзка, достъпен в публичната мрежа. Подходящо е за ситуации, в които първо трябва да качите изображение и след това да използвате URL адреса, за да извикате интерфейса за разпознаване.

Име на параметъра Задължително Тип Описание
(Документ) е File Файлове с изображения, качени на няколко части.

Пример от задната страна

✅ Успешен отговор:

https://cdn.example.com/uploads/abc123.jpg

❌ Неуспешен отговор (файлът не е качен или изключение за качване):

no

Връща обикновен текст no Показва, че файлът не е получен или е настъпило изключение по време на процеса на качване.

5. Интерфейс за проверка на баланса (API квота)

Заявка URL: /Code.aspx?op=count&app=api&token=YOUR_TOKEN

Метод на извикване: GET

Чрез този интерфейс можете да видите броя пъти, в които токен е бил използван днес, както и оставащата квота.

Пример от задната страна

✅ Успешен отговор:

{
  "Account": "api",
  "TodayCount": 52, // Използвано днес"LimitCount": 9948       // Общият брой на текущите локомотиви остава
}

❌ Отговор при неуспех (невалиден или непредаден токен):

{
  "Account": "api",
  "TodayCount": 0,
  "LimitCount": 0
}

Забележка: Ако токенът е невалиден, няма да се отчете грешка, но ще върне JSON с всички стойности 0, в зависимост от това дали LimitCount е да или не 0 за оценка на валидността на жетона.

💻 Онлайн въвеждане в експлоатация & Код за достъп
// Изчакай заявката да бъде изпратена...
📋 Код за бърз достъп (Следвайте горните опции, за да генерирате автоматично)
Code Snippet
След като изберете интерфейса и параметрите, той ще бъде автоматично генериран...
OCR асистент QQ онлайн обслужване на клиенти
Обслужване на клиенти на QQ(365833440)
OCR асистент за потребителска комуникация QQ
QQГрупа(100029010)
OCR асистент – свържете се с обслужването на клиенти по имейл
Пощенска кутия:net10010@qq.com

Благодаря за коментарите и предложенията!