OCR-Texterkennungsassistent

Leitfaden zur Entwicklung von Open-API-Schnittstellen

Erhalten Sie API-Guthaben

Willkommen auf der OCR Text Recognition Assistant Open Platform!
Wir bieten stabile, schnelle Textextraktionen und Tabellenerkennungsdienste an.

1. Globaler Authentifizierungsmechanismus (Auth)

Alle Schnittstellenanfragen müssen die folgenden Authentifizierungsparameter in der URL enthalten:

Parametername Erforderlich Beschreibung
app ist Festwert api
token ist Du kannst es finden in Persönliches Zentrum Hol dir deinen eigenen Token
2. Identifizieren Sie die Kernschnittstelle (op = Code)

Anfrage-URL: /Code.ashx?op=code&app=api&token=YOUR_TOKEN&type=0

Aufrufmethode: POST

Die Parameter werden einheitlich in der URL geschrieben, und die Bilddaten werden durch den POST-Körper geleitet (Multipart wird unterstützt) Dateifluss, Formularfeld oder Klartext).

2.1 Geben Sie das zu erkennende Bild ein (wählen Sie eines von drei)

Parametername Typ Beschreibung
(Dokument) File Standarder mehrteiliger Upload-Dateifluss.
url String Das öffentliche Netzwerk des Bildes kann auf die direkte Linkadresse zugreifen.
code String Base64-String des Images (keine Header-Formatierungsdeklaration erforderlich).

2.2 Kernmodus und Motorsteuerung

Parametername Erforderlich Beschreibung
type Nein Identifizieren Sie Muster:
0: Texterkennung (Default)
1: Vertikale Identifikation
2: Tabellenerkennung
3: Formelerkennung (Zum Beispiel MathPix)

2.3 Formatierungs- und Layoutregeln (optional)

Die folgenden Parameter passieren Werte 1 Schalte die entsprechende Verarbeitung ein, Wert 0 Nicht an.
Wenn kein spezieller Bedarf besteht, wird empfohlen, ihn nicht weiterzugeben und es dem System zu überlassen, die Entscheidung zu übernehmen:

Parametername Erforderlich Beschreibung
left Nein Biografie 1 Erzwingen von links nach rechts Sortiernähen.
top Nein Biografie 1 Erzwungene Sortierung von oben nach unten.
autodirection Nein Biografie 1 Bestimmt automatisch die Ausrichtung des Bildes und dreht es zur Ausrichtung.
half Nein Biografie 1 Automatische vollbreitige Satzzeichen auf reguläre Halbbreite.
space Nein Biografie 1 Verwaltet automatisch Wortleerzeichen zwischen englischen und chinesischen, japanischen und koreanischen Schriftzeichen.
symbol Nein Biografie 1 Korrigiere automatisch seltsame Satzzeichen.
duplicate Nein Biografie 1 Bindestriche werden automatisch ent-wiederholt.

2.4 Rückgabe-Wertbeschreibung (JSON)

Die Erkennungsschnittstelle liefert ein Standard-JSON-Format. Der Wert ist null Feld wird automatisch weggelassen.

Top-Level-Felder

Feld Typ Beschreibung
id String Die eindeutige Batch-ID (UUID-Format) dieser Anfrage kann verwendet werden, um die Ergebnisse asynchron abzufragen.
ocrType Int Identifizieren Sie den Typ mit den Anfrageparametern type Korrespondenz.
processId Int Die ID des Engine-Knotens, der die Anfrage bearbeitet hat.
processName String Prozess-Engine-Namen. Wenn leer, bedeutet das, dass die Erkennung abgelaufen ist oder einem Knoten nicht zugewiesen wurde.
state Int Handle-Statuscodes (siehe Aufzählungstabelle unten).
message String Zusätzliche Nachrichten-/Fehlerbeschreibung, die nur in Ausnahmefällen zurückgegeben wird.
result Object Kernidentifikationsergebnisobjekte (siehe die untenstehende Unterfeldtabelle für Details).
desc String Zusätzliche beschreibende Informationen, falls vorhanden, an die Engine angehängt sind.

result Sub-Objekt – Textergebnis

Feld Typ Beschreibung
autoText String Empfohlene Verwendung。 Vollständiger Text mit intelligenter Absatzzusammenführung und Optimierung des Layouts.
spiltText String Text, unterteilt nach Originalabsatz (zwischen Absätzen) \t Einzug + \n Zeilenumbruch). Im tabellarischen Modus sind die Daten JSON-Spalten.
transText String Übersetze den resultierenden Text (nur in type=Übersetzung Modusrückgaben, Struktur mit spiltText Korrespondenz).
lang String Die von der Engine automatisch erkannte Bildsprach-Identifikator (z. B. chi_sim, eng, jpn)。
resultType Int Ergebnisformattyp.0= Klartext, 1= Webseite (mit Formelrendering), 2= Tisch.

result Teilobjekt – Koordinatenpositionsdaten 🗺️

Die folgenden Felder enthalten die genaue Position jedes Textblocks im Originalbild, geeignet für Szenarien wie das Markieren von Überlagerungen, Flächenextraktion usw.

Feld Typ Beschreibung
spiltLocText String Ursprünglicher segmentierter Text mit Koordinateninformationen (Ergebnis des Smart Paragraph-Merge, einschließlich Standortinformationen).
transLocText String Übersetzter segmentierter Text mit Koordinateninformationen.
verticalText String (JSON) ⭐ Ein JSON-String eines vollständigen Textblockkoordinaten-Arrays. Eins für jedes Element TextCellInfo Objekt (siehe Struktur unten).

verticalText TextCellInfo-Objektstruktur

[
  {
    "words": "Der erkannte Textinhalt",
    "trans": "Übersetzungsergebnisse (falls vorhanden)",
    "pageIndex": 0,
    "location": {
      "left": 120.0,
      "top": 45.0,
      "width": 230.0,
      "height": 28.0
    }
  },
  ...
]
Feld Typ Beschreibung
words String Der Text wird von diesem Textblock erkannt.
trans String Übersetzungsergebnisse (nur im Übersetzungsmodus bewertet).
pageIndex Int Seitenzahlenindex (gültig in mehrseitigen Dokumentenszenarien, beginnend bei 0).
location.left Double X-Koordinaten (Pixel) in der oberen linken Ecke des Textblocks.
location.top Double Die Y-Koordinate (Pixel) in der oberen linken Ecke des Textblocks.
location.width Double Textblockbreite (in Pixeln).
location.height Double Textblockhöhe (in Pixeln).

result Sub-Objekt – Dateidownload

Feld Typ Beschreibung
viewUrl String Wenn resultType=1 (Webseite/Formel), die Adresse der Online-Vorschauseite zurückgegeben wurde.
downloadHtml String HTML-Ausschnitt mit Download-Links.
files Array Eine Liste der Ergebnisdateien, die zum Download verfügbar sind, von denen jede wie folgt lautet: DownLoadInfo Objekt (siehe Struktur unten).

files Die DownLoadInfo-Objektstruktur in der DownLoadInfo-Objektstruktur

Feld Typ Beschreibung
url String Die Datei-Downloadadresse.
param String Laden Sie die zusätzlichen Parameter herunter, die Sie benötigen.
fileType Int Dateityp-Aufzählung:1=PDF, 2=Word, 3=PPT, 4=Excel, 5=TXT, 6=Markdown
desc String Dokumentbeschreibung.

state Staatsaufzählung

Wert Bedeutung Beschreibung
0 Ausstehend Die Anfrage wurde eingegangen und die Engine noch nicht zugewiesen.
2 Erfolgreiche Verarbeitung Die Rücksenderkennung ist normal.
3 Bearbeitung fehlgeschlagen Der Engine verarbeitet eine Ausnahme und kann erneut versucht werden.
4 Bearbeitungszeitbegrenzung Der Motor kehrte innerhalb der Gültigkeitsdauer nicht zurück.
6 Nebenläufigkeitsgrenze Es gibt zu viele gleichzeitige Anfragen, also bitte reduzieren Sie die Häufigkeit.
7 Typen werden nicht unterstützt Der aktuelle Erkennungstyp oder das Dateiformat wird nicht unterstützt.

Rückenbeispiel

✅ Erfolgreiche Antwort (mit Koordinatendaten):

{
  "ocrType": 0,
  "id": "a1b2c3d4-e5f6-7890-abcd-ef1234567890",
  "processId": 3,
  "processName": "OCR-Node-01",
  "state": 2,
  "result": {
    "autoText": "Vollständiger Text nach Smart Merge",
    "spiltText": "Originaltext nach Absätzen unterteilt",
    "verticalText": "[{\"words\":\"Hallo\",\"location\":{\"left\":10,\"top\":20,\"width\":80,\"height\":22}}]",
    "resultType": 0,
    "lang": "chi_sim"
  }
}

❌ Fehler-/Limitantantwort:

{
  "ocrType": 0,
  "processName": "Tipps",
  "result": {
    "spiltText": "Die heutige API-Quote ist erschöpft, bitte laden Sie auf und nutzen Sie sie weiter.!",
    "autoText": "Die heutige API-Quote ist erschöpft, bitte laden Sie auf und nutzen Sie sie weiter.!"
  },
  "id": 1
}
3. Asynchrone Ergebnisanfrage (op = idcode)

Anfrage-URL: /Code.ashx?op=idcode&app=api&token=YOUR_TOKEN

Aufrufmethode: POST

Funktion: Zurückgegeben gemäß der Erkennungsschnittstelle id Abfrage der Ergebnisse der asynchronen Verarbeitung. Wenn die Erkennungsschnittstelle zurückkehrt state=0(ausstehend), können Sie diese Oberfläche nutzen, um das Endergebnis zu erhalten.

Parametername Erforderlich Typ Beschreibung
id ist String Identifizieren Sie die von der Schnittstelle zurückgegebene Batch-Anfrage-ID und leiten Sie sie durch den POST-Body weiter.

Rückenbeispiel

✅ Erfolgreiche Antwort:

[
  {
    "ocrType": 0,
    "id": "a1b2c3d4-...",
    "processName": "OCR-Node-01",
    "state": 2,
    "result": {
      "autoText": "Identifizieren Sie den resultierenden Text",
      "spiltText": "Segmentierter Text",
      "resultType": 0
    }
  }
]

❌ Fehlgeschlagene Antwort (ID existiert nicht oder Ergebnis ist abgelaufen):

no

Gibt Klartext zurück no Zeigt an, dass für diese ID kein Ergebnis gefunden wurde, die möglicherweise eine ID ist Der Fehler oder das Ergebnis ist abgelaufen und beseitigt.

4. Bild-Upload-Bett (op = imgUpload)

Anfrage-URL: /Code.ashx?op=imgUpload&app=api&token=YOUR_TOKEN

Aufrufmethode: POST (multipart/form-data)

Funktion: Laden Sie ein Bild auf das kostenlose Bildbett hoch und geben Sie eine direkte Link-URL zurück, die im öffentlichen Netzwerk zugänglich ist. Sie eignet sich für Situationen, in denen Sie zuerst ein Bild hochladen und dann die URL verwenden, um die Erkennungsoberfläche aufzurufen.

Parametername Erforderlich Typ Beschreibung
(Dokument) ist File Bilddateien in mehrteiliger Form hochgeladen.

Rückenbeispiel

✅ Erfolgreiche Antwort:

https://cdn.example.com/uploads/abc123.jpg

❌ Fehlgeschlagene Antwort (Datei nicht hochgeladen oder Upload-Ausnahme):

no

Gibt Klartext zurück no Zeigt an, dass die Datei nicht empfangen wurde oder während des Hochladens eine Ausnahme eingetreten ist.

5. Balance Inquiry Interface (API-Quote)

Anfrage-URL: /Code.aspx?op=count&app=api&token=YOUR_TOKEN

Aufrufmethode: GET

Über diese Benutzeroberfläche können Sie sehen, wie oft der Token heute verwendet wurde und wie oft die verbleibende Quote vorhanden ist.

Rückenbeispiel

✅ Erfolgreiche Antwort:

{
  "Account": "api",
  "TodayCount": 52, // Heute gebraucht"LimitCount": 9948       // Die Gesamtzahl der aktuellen Ströme bleibt übrig
}

❌ Fehlerantwort (ungültiges oder nicht übertragenes Token):

{
  "Account": "api",
  "TodayCount": 0,
  "LimitCount": 0
}

Hinweis: Wenn das Token ungültig ist, wird kein Fehler gemeldet, aber es wird JSON mit allen Werten von 0 zurückgegeben, abhängig davon, ob der LimitCount ja ist oder nicht. 0, um die Gültigkeit des Tokens zu beurteilen.

💻 Online-Inbetriebnahme & Zugangscode
// Warte auf die Anfrage, die gesendet wird....
📋 Schnellzugriffscode (Folgen Sie den obigen Optionen, um automatisch zu generieren)
Code Snippet
Nach Auswahl der Schnittstelle und der Parameter wird es automatisch generiert...
OCR Assistant QQ Online-Kundenservice
QQ-Kundenservice(365833440)
OCR Assistant QQ Benutzerkommunikationsgruppe
QQGruppe(100029010)
OCR-Assistent kontaktieren Sie den Kundenservice per E-Mail
Briefkasten:net10010@qq.com

Danke für eure Kommentare und Vorschläge!