OCR szövegfelismerő asszisztens

Nyílt API interfész fejlesztési útmutató

Szerezz API krediteket

Üdvözlünk az OCR Text Recognition Assistant Open Platformon!
Stabil, nagy sebességű, dobozból kibontható szövegkinyerési és táblázatfelismerő szolgáltatásokat nyújtunk.

1. Globális hitelesítési mechanizmus (hitelesítés)

Minden interfész kérésnek az alábbi hitelesítési paramétereket kell tartalmaznia az URL-ben:

Paraméter név Kötelező Leírás
app az Fix érték api
token az Megtalálod Személyes központ Szerezz saját tokent
2. Azonosítsd a maginterfészt (op = kód)

URL kérés: /Code.ashx?op=code&app=api&token=YOUR_TOKEN&type=0

Hívás módszer: POST

A paraméterek egyenletesen vannak írva az URL-ben, és a képadatok áthaladnak a POST testen keresztül (többrészes támogatás is támogatott) fájl áramlása, űrlapmező vagy egyszerű szöveg).

2.1 Adja meg az ismerhető képet (válassz egyet a három közül)

Paraméter név Típus Leírás
(Dokumentum) File A szokásos többrészes feltöltési fájl folyamat.
url String A kép nyilvános hálózata hozzáférhet a közvetlen linki címhez.
code String Base64 karakterlánc (nem szükséges fejlécformázási nyilatkozatot bevonni).

2.2 Mag üzemmód és motorvezérlés

Paraméter név Kötelező Leírás
type Nem Azonosítsd a mintákat:
0: Szövegfelismerés (Alapértelmezés)
1: Függőleges azonosítás
2: Táblázatfelismerés
3: Képlefelismerés (Például: MathPix)

2.3 Formázás és elrendezési szabályok (opcionális)

Az alábbi paraméterek továbbítják az értékeket 1 Kapcsold be a megfelelő feldolgozási értéket 0 Nem kapcsolva.
Ha nincs konkrét szükség, ajánlott, hogy ne adjuk tovább, és a rendszer döntse el:

Paraméter név Kötelező Leírás
left Nem Életrajz 1 Kényszerítsd a balról jobbra történő varrást a sort.
top Nem Életrajz 1 Erő szűrést felülről lefelé.
autodirection Nem Életrajz 1 Automatikusan meghatározza a kép orientációját, és elforgatja, hogy igazítsa.
half Nem Életrajz 1 Automatikus teljes szélességű írásjel normál félszélességig.
space Nem Életrajz 1 Automatikusan kezeli az angol és kínai, japán és koreai karakterek közötti szóközeket.
symbol Nem Életrajz 1 Automatikusan javítsd ki a furcsa írásjeleket.
duplicate Nem Életrajz 1 Automatikusan deszne a kötőjeleket.

2.4 Visszatérítési érték leírása (JSON)

Az ismerő felület szabványos JSON formátumot ad vissza. Az érték a következőképpen null A mező automatikusan kihagyható.

Felső szintű mezők

Mező Típus Leírás
id String Ennek a kérésnek az egyedi batch ID-je (UUID formátum) aszinkron lekérdezésre használható.
ocrType Int Azonosítsuk a típust a kérésparaméterekkel type levelezés.
processId Int A motorcsomópont azonosítója, amely kezelte a kérést.
processName String Dolgozd fel a motor neveket. Az üres jelzés azt jelenti, hogy az elismerés időzítette vagy nem volt hozzá rendelve egy csomóponthoz.
state Int Kezeld az állapotkódokat (lásd az alábbi felsorolási táblázatot).
message String További üzenet/hibaleírás, amely csak kivételes esetekben jelenik meg.
result Object Magazonosítási eredményobjektumok (lásd az alábbi almező táblázatot a részletekért).
desc String További leíró információk a motorhoz csatolva, ha egyáltalán vannak.

result Alobjektum – Szöveg eredmény

Mező Típus Leírás
autoText String Ajánlott felhasználás。 Teljes szöveg intelligens bekezdésösszevonással és elrendezésoptimalizálással.
spiltText String Szöveg eredeti bekezdés szerint (bekezdések között \t Behúzás + \n sortörés). Táblázatos módban az adatok JSON oszlopok.
transText String Fordítsd le a kapott szöveget (csak a type=Fordítás mód visszatérések, szerkezet spiltText levelezés).
lang String A képnyelvi azonosítót a motor automatikusan érzékelte (pl. chi_sim, eng, jpn)。
resultType Int Eredményformátum típus.0= egyszerű szöveg, 1= weboldal (képletmegjelenítéssel), 2= Asztal.

result Al-objektum - koordináta pozicionálási adatok 🗺️

Az alábbi mezők minden szövegblokk pontos pozícióját az eredeti képen tartalmazzák, amelyek alkalmasak olyan helyzetekhez, mint a fedőrétegek kiemelése, területek kivonása stb.

Mező Típus Leírás
spiltLocText String Eredeti szegmentált szöveg koordináta-információval (okos bekezdés összevonásának eredménye, beleértve a helyinformációt is).
transLocText String Fordított szegmentált szöveg koordináta információval.
verticalText String (JSON) ⭐ Egy teljes szövegblokk koordináta-tömbből álló JSON string. Egyet minden elemhez TextCellInfo objektum (lásd szerkezet lent).

verticalText TextCellInfo objektumszerkezet

[
  {
    "words": "A szöveg, amelyet felismernek",
    "trans": "Fordítási eredmények (ha vannak)",
    "pageIndex": 0,
    "location": {
      "left": 120.0,
      "top": 45.0,
      "width": 230.0,
      "height": 28.0
    }
  },
  ...
]
Mező Típus Leírás
words String A szöveg a szöveg által felismerhető blokk.
trans String Fordítási eredmények (csak fordítási módban értékesek).
pageIndex Int Oldalszám-index (érvényes többoldalas dokumentumhelyzetekben, 0-tól kezdve).
location.left Double X koordináták (pixelek) a szövegblokk bal felső sarkában.
location.top Double Az Y koordináta (pixelek) a szövegblokk bal felső sarkában.
location.width Double Szövegblokk szélessége (pixelekben).
location.height Double Szövegblokk magassága (pixelekben).

result Alobjektum - Fájlletöltés

Mező Típus Leírás
viewUrl String Amikor resultType=1 (weboldal/képlet), visszaküldte az online előnézeti oldal címét.
downloadHtml String HTML részlet letöltési linkekkel.
files Array Egy lista letölthető eredményfájlokról, amelyek mindegyike a következő: DownLoadInfo objektum (lásd szerkezet lent).

files A DownLoadInfo objektumstruktúra a DownLoadInfo objektumstruktúrában

Mező Típus Leírás
url String A fájl letöltési címe.
param String Töltsd le a szükséges további paramétereket.
fileType Int Fájltípus felsorolás:1=PDF, 2=Word, 3=PPT, 4=Excel, 5=TXT, 6=Markdown
desc String Dokumentumleírás.

state Állami felsorolás

Érték Jelentés Leírás
0 Függőben A kérést megérkezik, de a motort nem osztották ki.
2 Sikeres feldolgozás A visszaküldés felismerése általában így lesz.
3 Feldolgozás sikertelen A motor kivételt kezel, és újra meg lehet próbálni.
4 Feldolgozási időkorlát A motor nem tért vissza a érvényességi időszakon belül.
6 Egyidejű korlátozás Túl sok egyidejű kérés van, ezért kérlek, csökkentsd a gyakoriságot.
7 A típusok nem támogatottak A jelenlegi felismerési típus vagy fájlformátum nem támogatott.

Vissza példa

✅ Sikeres válasz (koordinátaadatokkal):

{
  "ocrType": 0,
  "id": "a1b2c3d4-e5f6-7890-abcd-ef1234567890",
  "processId": 3,
  "processName": "OCR-Node-01",
  "state": 2,
  "result": {
    "autoText": "Teljes szöveg okos összevonás után",
    "spiltText": "Az eredeti szöveg bekezdésekre szegélyezve",
    "verticalText": "[{\"words\":\"Helló\",\"location\":{\"left\":10,\"top\":20,\"width\":80,\"height\":22}}]",
    "resultType": 0,
    "lang": "chi_sim"
  }
}

❌ Hiba/Limit válasz:

{
  "ocrType": 0,
  "processName": "Tippek",
  "result": {
    "spiltText": "A mai API kvóta kimerült, kérjük, töltsd fel és használd tovább!",
    "autoText": "A mai API kvóta kimerült, kérjük, töltsd fel és használd tovább!"
  },
  "id": 1
}
3. Aszinkron eredménylekérdezés (op = idcode)

URL kérés: /Code.ashx?op=idcode&app=api&token=YOUR_TOKEN

Hívás módszer: POST

Funkció: A felismerő felület szerint visszaadva id Kérdezze az aszinkron feldolgozás eredményeit. Amikor a felismerő felület visszatér state=0(függőben), ezt a felületet használhatod a szavazáshoz, hogy megkapd a végső eredményt.

Paraméter név Kötelező Típus Leírás
id az String Azonosítsd a felület által visszaküldött batch request ID-t, és továbbítsd a POST testen.

Vissza példa

✅ Sikeres válasz:

[
  {
    "ocrType": 0,
    "id": "a1b2c3d4-...",
    "processName": "OCR-Node-01",
    "state": 2,
    "result": {
      "autoText": "Azonosítsuk az eredményt",
      "spiltText": "Szegmentált szöveg",
      "resultType": 0
    }
  }
]

❌ Sikertelen válasz (azonosító nem létezik vagy az eredmény lejárt):

no

Egyszerű szöveget ad vissza no Ez azt jelzi, hogy nem találtak eredményt az adott azonosítóra, ami lehet azonosító A hiba vagy eredmény lejárt, és törölhető.

4. Képfeltöltési ágy (op = imgUpload)

URL kérés: /Code.ashx?op=imgUpload&app=api&token=YOUR_TOKEN

Hívás módszer: POST (multipart/form-data)

Funkció: Tölts fel egy képet az ingyenes képágyra, és küldj vissza egy közvetlen link URL-t, amely elérhető a nyilvános hálózaton. Alkalmas olyan helyzetekre, amikor először fel kell tölteni egy képet, majd az URL-t kell használni az felismerő interfész meghívására.

Paraméter név Kötelező Típus Leírás
(Dokumentum) az File Képfájlok több részben töltve fel.

Vissza példa

✅ Sikeres válasz:

https://cdn.example.com/uploads/abc123.jpg

❌ Sikertelen válasz (fájl nem feltöltés vagy feltöltési kivétel):

no

Egyszerű szöveget ad vissza no Ez azt jelzi, hogy a fájlt nem kapták meg, vagy kivétel történt a feltöltés során.

5. Mérlegvizsgálati felület (API kvóta)

URL kérés: /Code.aspx?op=count&app=api&token=YOUR_TOKEN

Hívás módszer: GET

Ezen az interfészen keresztül megtekintheted, hányszor használták a tokent ma, és a fennmaradó kvótát.

Vissza példa

✅ Sikeres válasz:

{
  "Account": "api",
  "TodayCount": 52, // Ma használt"LimitCount": 9948       // Az áram fennmaradt összes száma
}

❌ Hiba válasz (érvénytelen vagy nem továbbított token):

{
  "Account": "api",
  "TodayCount": 0,
  "LimitCount": 0
}

Megjegyzés: Ha a token érvénytelen, nem jelentenek hiba, de a JSON minden értéke 0 lesz, attól függően, hogy a LimitCount igen-e vagy sem 0 a token érvényességének megítéléséhez.

💻 Online megrendelés & Hozzáférési kód
// Várd meg, amíg a kérés elküldve...
📋 Gyors hozzáférési kód (Kövesd a fenti opciókat az automatikus generáláshoz)
Code Snippet
Miután kiválasztod az interfészt és a paramétereket, automatikusan generálódik...
OCR asszisztens QQ online ügyfélszolgálat
QQ ügyfélszolgálat(365833440)
OCR asszisztens QQ felhasználói kommunikációs csoport
QQCsoport(100029010)
OCR asszisztens vegye fel a kapcsolatot az ügyfélszolgálattal e-mailben
Postaláda:net10010@qq.com

Köszönöm a hozzászólásokat és javaslatokat!