Anfrage-URL:
/Code.ashx?op=code&app=api&token=YOUR_TOKEN&type=0
Aufrufmethode: POST
Die Parameter werden einheitlich in der URL geschrieben, und die Bilddaten werden durch den POST-Körper geleitet (Multipart wird unterstützt)
Dateifluss, Formularfeld oder Klartext).
2.1 Geben Sie das zu erkennende Bild ein (wählen Sie eines von drei)
| Parametername |
Typ |
Beschreibung |
| (Dokument) |
File |
Standarder mehrteiliger Upload-Dateifluss. |
| url |
String |
Das öffentliche Netzwerk des Bildes kann auf die direkte Linkadresse zugreifen. |
| code |
String |
Base64-String des Images (keine Header-Formatierungsdeklaration erforderlich). |
2.2 Kernmodus und Motorsteuerung
| Parametername |
Erforderlich |
Beschreibung |
| type |
Nein |
Identifizieren Sie Muster:
0: Texterkennung (Default)
1: Vertikale Identifikation
2: Tabellenerkennung
3: Formelerkennung (Zum Beispiel MathPix)
|
2.3 Formatierungs- und Layoutregeln (optional)
Die folgenden Parameter passieren Werte 1 Schalte die entsprechende Verarbeitung ein, Wert 0 Nicht an.
Wenn kein spezieller Bedarf besteht, wird empfohlen, ihn nicht weiterzugeben und es dem System zu überlassen, die Entscheidung zu übernehmen:
| Parametername |
Erforderlich |
Beschreibung |
| left |
Nein |
Biografie 1 Erzwingen von links nach rechts Sortiernähen. |
| top |
Nein |
Biografie 1 Erzwungene Sortierung von oben nach unten. |
| autodirection |
Nein |
Biografie 1 Bestimmt automatisch die Ausrichtung des Bildes und dreht es zur Ausrichtung. |
| half |
Nein |
Biografie 1 Automatische vollbreitige Satzzeichen auf reguläre Halbbreite. |
| space |
Nein |
Biografie 1 Verwaltet automatisch Wortleerzeichen zwischen englischen und chinesischen, japanischen und koreanischen Schriftzeichen. |
| symbol |
Nein |
Biografie 1 Korrigiere automatisch seltsame Satzzeichen. |
| duplicate |
Nein |
Biografie 1 Bindestriche werden automatisch ent-wiederholt. |
2.4 Rückgabe-Wertbeschreibung (JSON)
Die Erkennungsschnittstelle liefert ein Standard-JSON-Format. Der Wert ist null Feld wird automatisch weggelassen.
Top-Level-Felder
| Feld |
Typ |
Beschreibung |
| id |
String |
Die eindeutige Batch-ID (UUID-Format) dieser Anfrage kann verwendet werden, um die Ergebnisse asynchron abzufragen. |
| ocrType |
Int |
Identifizieren Sie den Typ mit den Anfrageparametern type Korrespondenz. |
| processId |
Int |
Die ID des Engine-Knotens, der die Anfrage bearbeitet hat. |
| processName |
String |
Prozess-Engine-Namen. Wenn leer, bedeutet das, dass die Erkennung abgelaufen ist oder einem Knoten nicht zugewiesen wurde. |
| state |
Int |
Handle-Statuscodes (siehe Aufzählungstabelle unten). |
| message |
String |
Zusätzliche Nachrichten-/Fehlerbeschreibung, die nur in Ausnahmefällen zurückgegeben wird. |
| result |
Object |
Kernidentifikationsergebnisobjekte (siehe die untenstehende Unterfeldtabelle für Details). |
| desc |
String |
Zusätzliche beschreibende Informationen, falls vorhanden, an die Engine angehängt sind. |
result Sub-Objekt – Textergebnis
| Feld |
Typ |
Beschreibung |
| autoText |
String |
⭐ Empfohlene Verwendung。 Vollständiger Text mit intelligenter Absatzzusammenführung und Optimierung des Layouts. |
| spiltText |
String |
Text, unterteilt nach Originalabsatz (zwischen Absätzen) \t Einzug + \n Zeilenumbruch). Im tabellarischen Modus sind die Daten JSON-Spalten. |
| transText |
String |
Übersetze den resultierenden Text (nur in type=Übersetzung Modusrückgaben, Struktur mit spiltText Korrespondenz). |
| lang |
String |
Die von der Engine automatisch erkannte Bildsprach-Identifikator (z. B. chi_sim, eng, jpn)。 |
| resultType |
Int |
Ergebnisformattyp.0= Klartext, 1= Webseite (mit Formelrendering), 2= Tisch. |
result Teilobjekt – Koordinatenpositionsdaten 🗺️
Die folgenden Felder enthalten die genaue Position jedes Textblocks im Originalbild, geeignet für Szenarien wie das Markieren von Überlagerungen, Flächenextraktion usw.
| Feld |
Typ |
Beschreibung |
| spiltLocText |
String |
Ursprünglicher segmentierter Text mit Koordinateninformationen (Ergebnis des Smart Paragraph-Merge, einschließlich Standortinformationen). |
| transLocText |
String |
Übersetzter segmentierter Text mit Koordinateninformationen. |
| verticalText |
String (JSON) |
⭐ Ein JSON-String eines vollständigen Textblockkoordinaten-Arrays. Eins für jedes Element TextCellInfo Objekt (siehe Struktur unten). |
verticalText TextCellInfo-Objektstruktur
[
{
"words": "Der erkannte Textinhalt",
"trans": "Übersetzungsergebnisse (falls vorhanden)",
"pageIndex": 0,
"location": {
"left": 120.0,
"top": 45.0,
"width": 230.0,
"height": 28.0
}
},
...
]
| Feld |
Typ |
Beschreibung |
| words |
String |
Der Text wird von diesem Textblock erkannt. |
| trans |
String |
Übersetzungsergebnisse (nur im Übersetzungsmodus bewertet). |
| pageIndex |
Int |
Seitenzahlenindex (gültig in mehrseitigen Dokumentenszenarien, beginnend bei 0). |
| location.left |
Double |
X-Koordinaten (Pixel) in der oberen linken Ecke des Textblocks. |
| location.top |
Double |
Die Y-Koordinate (Pixel) in der oberen linken Ecke des Textblocks. |
| location.width |
Double |
Textblockbreite (in Pixeln). |
| location.height |
Double |
Textblockhöhe (in Pixeln). |
result Sub-Objekt – Dateidownload
| Feld |
Typ |
Beschreibung |
| viewUrl |
String |
Wenn resultType=1 (Webseite/Formel), die Adresse der Online-Vorschauseite zurückgegeben wurde. |
| downloadHtml |
String |
HTML-Ausschnitt mit Download-Links. |
| files |
Array |
Eine Liste der Ergebnisdateien, die zum Download verfügbar sind, von denen jede wie folgt lautet: DownLoadInfo Objekt (siehe Struktur unten). |
files Die DownLoadInfo-Objektstruktur in der DownLoadInfo-Objektstruktur
| Feld |
Typ |
Beschreibung |
| url |
String |
Die Datei-Downloadadresse. |
| param |
String |
Laden Sie die zusätzlichen Parameter herunter, die Sie benötigen. |
| fileType |
Int |
Dateityp-Aufzählung:1=PDF, 2=Word, 3=PPT,
4=Excel, 5=TXT, 6=Markdown
|
| desc |
String |
Dokumentbeschreibung. |
state Staatsaufzählung
| Wert |
Bedeutung |
Beschreibung |
| 0 |
Ausstehend |
Die Anfrage wurde eingegangen und die Engine noch nicht zugewiesen. |
| 2 |
Erfolgreiche Verarbeitung |
Die Rücksenderkennung ist normal. |
| 3 |
Bearbeitung fehlgeschlagen |
Der Engine verarbeitet eine Ausnahme und kann erneut versucht werden. |
| 4 |
Bearbeitungszeitbegrenzung |
Der Motor kehrte innerhalb der Gültigkeitsdauer nicht zurück. |
| 6 |
Nebenläufigkeitsgrenze |
Es gibt zu viele gleichzeitige Anfragen, also bitte reduzieren Sie die Häufigkeit. |
| 7 |
Typen werden nicht unterstützt |
Der aktuelle Erkennungstyp oder das Dateiformat wird nicht unterstützt. |
Rückenbeispiel
✅ Erfolgreiche Antwort (mit Koordinatendaten):
{
"ocrType": 0,
"id": "a1b2c3d4-e5f6-7890-abcd-ef1234567890",
"processId": 3,
"processName": "OCR-Node-01",
"state": 2,
"result": {
"autoText": "Vollständiger Text nach Smart Merge",
"spiltText": "Originaltext nach Absätzen unterteilt",
"verticalText": "[{\"words\":\"Hallo\",\"location\":{\"left\":10,\"top\":20,\"width\":80,\"height\":22}}]",
"resultType": 0,
"lang": "chi_sim"
}
}
❌ Fehler-/Limitantantwort:
{
"ocrType": 0,
"processName": "Tipps",
"result": {
"spiltText": "Die heutige API-Quote ist erschöpft, bitte laden Sie auf und nutzen Sie sie weiter.!",
"autoText": "Die heutige API-Quote ist erschöpft, bitte laden Sie auf und nutzen Sie sie weiter.!"
},
"id": 1
}