Assistant de reconnaissance de texte OCR

Guide de développement de l’interface API ouverte

Obtenez des crédits API

Bienvenue sur la plateforme ouverte de l’Assistant de Reconnaissance de Texte OCR !
Nous proposons des services d’extraction de texte et de reconnaissance de tables, stables, à haute vitesse, prêts à l’emploi.

1. Mécanisme d’authentification global (Authentification)

Toutes les requêtes d’interface doivent inclure les paramètres d’authentification suivants dans l’URL :

Nom du paramètre Obligatoire Description
app est Valeur fixe api
token est Vous pouvez le trouver dans Centre personnel Obtenez votre propre jeton
2. Identifier l’interface centrale (op = code)

URL de demande: /Code.ashx?op=code&app=api&token=YOUR_TOKEN&type=0

Méthode d’appel: POST

Les paramètres sont orthographiés uniformément dans l’URL, et les données de l’image sont transmises via le corps POST (multipart est pris en charge) flux de fichiers, champ de formulaire ou texte brut).

2.1 Entrez l’image pour être reconnu (choisissez l’une des trois)

Nom du paramètre Type Description
(Document) File Flux standard de fichiers d’upload multipartits.
url String Le réseau public de l’image peut accéder à l’adresse du lien direct.
code String Chaîne Base64 de l’image (pas besoin d’inclure une déclaration de formatage d’en-tête).

2.2 Mode de base et contrôle moteur

Nom du paramètre Obligatoire Description
type Non Identifiez les schémas :
0: Reconnaissance de texte (Par défaut)
1 : Identification verticale
2 : Reconnaissance de table
3: Reconnaissance de la formule (Comme MathPix)

2.3 Règles de mise en page et de mise en page (optionnelle)

Les paramètres suivants passent les valeurs 1 Active le traitement correspondant, valeur 0 Pas allumé.
S’il n’y a pas de besoin spécifique, il est recommandé de ne pas le transmettre, et de laisser le contrôle au système :

Nom du paramètre Obligatoire Description
left Non Biographie 1 Forcez le tri de gauche à droite.
top Non Biographie 1 Tri forcé de haut en bas.
autodirection Non Biographie 1 Détermine automatiquement l’orientation de l’image et la fait pivoter pour s’aligner.
half Non Biographie 1 Ponctuation automatique pleine largeur à demi-largeur classique.
space Non Biographie 1 Gère automatiquement les espaces entre les caractères anglais et chinois, japonais et coréens.
symbol Non Biographie 1 Corrige automatiquement la ponctuation étrange.
duplicate Non Biographie 1 Désactivez automatiquement les traits d’union répétés.

2.4 Description de la valeur de retour (JSON)

L’interface de reconnaissance restitue un format JSON standard. La valeur est null le champ est automatiquement omis.

Domaines de haut niveau

Champ Type Description
id String L’identifiant de lot unique (format UUID) de cette requête peut être utilisé pour interroger les résultats de manière asynchrone.
ocrType Int Identifier le type, avec les paramètres de requête type correspondance.
processId Int L’identifiant du nœud moteur qui a géré la requête.
processName String Noms des moteurs de procédé. Quand vide indique que la reconnaissance a expiré ou n’a pas été attribuée à un nœud.
state Int Gérer les codes d’état (voir le tableau d’énumération ci-dessous).
message String Description supplémentaire de message/erreur, qui n’est retournée que dans des cas exceptionnels.
result Object Objets de résultat d’identification des cœurs (voir le tableau des sous-champs ci-dessous pour plus de détails).
desc String Informations descriptives supplémentaires attachées au moteur, le cas échéant.

result Sous-objet – Résultat textuel

Champ Type Description
autoText String Utilisation recommandée。 Texte complet avec fusion intelligente des paragraphes et optimisation de la mise en page.
spiltText String Texte séparé par paragraphe original (entre les paragraphes \t Indentation + \n saut de ligne). En mode tabulaire, les données sont des colonnes JSON.
transText String Traduire le texte résultant (uniquement dans type=Translation modes retours, structure avec spiltText correspondance).
lang String L’identifiant de langue de l’image est automatiquement détecté par le moteur (par exemple chi_sim, eng, jpn)。
resultType Int Type de format du résultat.0= texte brut, 1= page web (avec rendu de formules), 2= Table.

result Sous-objet - données 🗺️ de positionnement des coordonnées

Les champs suivants contiennent la position précise de chaque bloc de texte sur l’image originale, adaptée à des scénarios tels que les surlignages, l’extraction de zone, etc.

Champ Type Description
spiltLocText String Texte segmenté original avec informations de coordonnées (résultat de la fusion intelligente des paragraphes, incluant les informations de localisation).
transLocText String Texte segmenté traduit avec informations de coordonnées.
verticalText String (JSON) ⭐ Une chaîne JSON d’un tableau de coordonnées de blocs textuels complets. Un pour chaque élément TextCellInfo objet (voir structure ci-dessous).

verticalText Structure d’objets TextCellInfo

[
  {
    "words": "Le contenu textuel reconnu",
    "trans": "Résultats de traduction (s’il y en a)",
    "pageIndex": 0,
    "location": {
      "left": 120.0,
      "top": 45.0,
      "width": 230.0,
      "height": 28.0
    }
  },
  ...
]
Champ Type Description
words String Le texte est reconnu par ce bloc de texte.
trans String Résultats de traduction (valorisés uniquement en mode traduction).
pageIndex Int Index des numéros de page (valide dans les scénarios de documents multipages, à partir de 0).
location.left Double Coordonnées X (pixels) dans le coin supérieur gauche du bloc de texte.
location.top Double La coordonnée Y (pixels) dans le coin supérieur gauche du bloc de texte.
location.width Double Largeur de bloc de texte (en pixels).
location.height Double Hauteur du bloc de texte (en pixels).

result Sous-objet - Téléchargement de fichier

Champ Type Description
viewUrl String Quand resultType=1 (page web/formule), l’adresse de la page d’aperçu en ligne est retournée.
downloadHtml String Extrait HTML avec liens de téléchargement.
files Array Une liste des fichiers de résultats disponibles à télécharger, chacun étant : DownLoadInfo objet (voir structure ci-dessous).

files La structure d’objet DownLoadInfo dans la structure d’objets DownLoadInfo

Champ Type Description
url String L’adresse de téléchargement du fichier.
param String Téléchargez les paramètres supplémentaires dont vous avez besoin.
fileType Int Énumération des types de fichiers :1=PDF, 2=Word, 3=PPT, 4=Excel, 5=TXT, 6=Markdown
desc String Description du document.

state Énumération par État

Valeur Signification Description
0 En attente La demande a été reçue et la locomotive n’a pas été assignée.
2 Traitement réussi Retour de reconnaissance des résultats normaux.
3 Échec du traitement Le moteur gère une exception et peut être réessayé.
4 Délai d’expiration du traitement Le moteur n’est pas revenu dans la période de validité.
6 Limite de concurrence Il y a trop de demandes simultanées, alors merci de réduire la fréquence.
7 Les types ne sont pas pris en charge Le type de reconnaissance actuel ou le format de fichier n’est pas pris en charge.

Exemple arrière

✅ Réponse réussie (avec données de coordonnées) :

{
  "ocrType": 0,
  "id": "a1b2c3d4-e5f6-7890-abcd-ef1234567890",
  "processId": 3,
  "processName": "OCR-Node-01",
  "state": 2,
  "result": {
    "autoText": "Texte complet après la fusion intelligente",
    "spiltText": "Texte original divisé par paragraphes",
    "verticalText": "[{\"words\":\"Bonjour\",\"location\":{\"left\":10,\"top\":20,\"width\":80,\"height\":22}}]",
    "resultType": 0,
    "lang": "chi_sim"
  }
}

❌ Réponse à l’erreur/limite :

{
  "ocrType": 0,
  "processName": "Conseils",
  "result": {
    "spiltText": "Le quota d’API d’aujourd’hui a été épuisé, merci de recharger et de continuer à l’utiliser!",
    "autoText": "Le quota d’API d’aujourd’hui a été épuisé, merci de recharger et de continuer à l’utiliser!"
  },
  "id": 1
}
3. Requête asynchrone des résultats (op = idcode)

URL de demande: /Code.ashx?op=idcode&app=api&token=YOUR_TOKEN

Méthode d’appel: POST

Fonction: Retourné selon l’interface de reconnaissance id Interrogez les résultats du traitement asynchrone. Quand l’interface de reconnaissance revient state=0(en attente), vous pouvez utiliser cette interface pour interroger afin d’obtenir le résultat final.

Nom du paramètre Obligatoire Type Description
id est String Identifiez l’ID de requête batch retourné par l’interface et faites-le passer dans le corps POST.

Exemple arrière

✅ Réponse réussie :

[
  {
    "ocrType": 0,
    "id": "a1b2c3d4-...",
    "processName": "OCR-Node-01",
    "state": 2,
    "result": {
      "autoText": "Identifier le texte résultant",
      "spiltText": "Texte segmenté",
      "resultType": 0
    }
  }
]

❌ Réponse échouée (ID n’existe pas ou résultat expiré) :

no

Retourne le texte clair no Indique qu’aucun résultat n’a été trouvé pour cet ID, qui pourrait être un ID L’erreur ou le résultat est expiré et est effacé.

4. Lit d’upload d’images (op = imgUpload)

URL de demande: /Code.ashx?op=imgUpload&app=api&token=YOUR_TOKEN

Méthode d’appel: POST (multipart/form-data)

Fonction: Téléchargez une image sur le lit d’images gratuit et retournez une URL de lien direct accessible sur le réseau public. Il convient aux situations où il faut d’abord télécharger une image puis utiliser l’URL pour appeler l’interface de reconnaissance.

Nom du paramètre Obligatoire Type Description
(Document) est File Fichiers image téléchargés en plusieurs parties.

Exemple arrière

✅ Réponse réussie :

https://cdn.example.com/uploads/abc123.jpg

❌ Réponse échouée (fichier non téléchargé ou exception de téléchargement) :

no

Retourne le texte clair no Indique que le fichier n’a pas été reçu ou qu’une exception a eu lieu pendant le processus de téléversement.

5. Interface d’enquête de solde (quota API)

URL de demande: /Code.aspx?op=count&app=api&token=YOUR_TOKEN

Méthode d’appel: GET

Grâce à cette interface, vous pouvez voir le nombre de fois où le jeton a été utilisé aujourd’hui et le quota restant.

Exemple arrière

✅ Réponse réussie :

{
  "Account": "api",
  "TodayCount": 52, // Utilisé aujourd’hui"LimitCount": 9948       // Le nombre total de restes actuels
}

❌ Réponse à l’échec (jeton invalide ou non transmis) :

{
  "Account": "api",
  "TodayCount": 0,
  "LimitCount": 0
}

Note : Si le jeton est invalide, aucune erreur ne sera signalée, mais le JSON sera retourné avec toutes les valeurs de 0, selon que le LimitCount est oui ou non 0 pour juger de la validité du jeton.

💻 Commande en ligne & Code d’accès
// Attends que la demande soit envoyée...
📋 Code d’accès rapide (Suivez les options ci-dessus pour générer automatiquement)
Code Snippet
Après avoir sélectionné l’interface et les paramètres, il sera automatiquement généré...
Assistant OCR QQ service client en ligne
Service client QQ(365833440)
Groupe de communication utilisateur de l’assistant OCR QQ
QQGroupe(100029010)
Assistant OCR contactez le service client par email
Boîte aux lettres:net10010@qq.com

Merci pour vos commentaires et suggestions !