ओसीआर पाठ पहिचान सहायक

एपीआई इन्टरफेस विकास मार्गदर्शक खोल्नुहोस्

एपीआई क्रेडिटहरू प्राप्त गर्नुहोस्

ओसीआर पाठ पहिचान सहायक खुला प्लेटफर्ममा स्वागत छ!
हामी स्थिर, उच्च-गति, आउट-अफ-द-बक्स पाठ निकासी र तालिका पहिचान सेवाहरू प्रदान गर्दछौं।

१. विश्वव्यापी प्रमाणीकरण संयन्त्र (प्रमाणीकरण)

सबै इन्टरफेस अनुरोधहरूले यूआरएलमा निम्न प्रमाणीकरण परामितिहरू समावेश गर्नुपर्दछ:

परिमिति नाम आवश्यक छ वर्णन
app हो स्थिर मान api
token हो तपाईं यसलाई फेला पार्न सक्नुहुन्छ व्यक्तिगत केन्द्र तपाईँको आफ्नै टोकन प्राप्त गर्नुहोस्
२. कोर इन्टरफेस पहिचान गर्नुहोस् (op = कोड)

यूआरएल अनुरोध गर्नुहोस्: /Code.ashx?op=code&app=api&token=YOUR_TOKEN&type=0

कल गर्ने तरिका: POST

प्यारामिटरहरू समान रूपमा URL मा हिज्जे गरिएको छ, र छवि डेटा POST शरीर मार्फत पारित गरिएको छ (मल्टिपार्ट समर्थित छ फाइल प्रवाह, फारम फाँट, वा सादा पाठ)।

2.1 पहिचान गर्न छवि प्रविष्ट गर्नुहोस् (तीनमध्ये कुनै एक छनौट गर्नुहोस्)

परिमिति नाम प्रकार वर्णन
(कागजात) File मानक बहुभाग अपलोड फाइल प्रवाह।
url String तस्वीरको सार्वजनिक नेटवर्कले सिधा लिङ्क ठेगानामा पहुँच गर्न सक्दछ।
code String छविको आधार ६४ स्ट्रिङ (हेडर ढाँचा घोषणा समावेश गर्न आवश्यक छैन)।

2.2 कोर मोड र इन्जिन नियन्त्रण

परिमिति नाम आवश्यक छ वर्णन
type होइन बाँन्की पहिचान गर्नुहोस्:
0: पाठ पहिचान (पूर्वनिर्धारित)
१: ठाडो पहिचान
२: तालिका पहिचान
3: सूत्र मान्यता (जस्तै MathPix)

2.3 ढाँचा र सजावट नियमहरू (वैकल्पिक)

निम्न परिमितिले मान पास गर्दछ 1 सङ्गत प्रशोधन, मान खोल्नुहोस् 0 मा छैन।
यदि त्यहाँ कुनै विशेष आवश्यकता छैन भने, यो सिफारिस गरिएको छ कि यसलाई पारित नगर्नुहोस्, र यसलाई निर्णय गर्न प्रणालीमा छोड्नुहोस्:

परिमिति नाम आवश्यक छ वर्णन
left होइन जीवनी 1 बायाँबाट दायाँ क्रमबद्ध सिलाई जोर गर्नुहोस् ।
top होइन जीवनी 1 माथिबाट तलसम्म क्रमबद्ध गर्न बल गर्नुहोस् ।
autodirection होइन जीवनी 1 स्वचालित रूपमा छविको अभिमुखिकरण निर्धारण गर्दछ र पङ्क्तिबद्ध गर्न यसलाई घुमाउँदछ ।
half होइन जीवनी 1 नियमित आधा-चौडाइमा स्वचालित पूर्ण-चौडाइ विराम चिन्ह।
space होइन जीवनी 1 स्वचालित रूपमा अङ्ग्रेजी र चिनियाँ, जापानी, र कोरियाली क्यारेक्टरहरू बीच शब्द खाली स्थानहरू ह्यान्डल गर्दछ।
symbol होइन जीवनी 1 स्वचालित रूपमा अनौठो विराम चिन्हहरू सच्याउनुहोस्।
duplicate होइन जीवनी 1 स्वचालित रूपमा दोहोर्याउनुहोस् हाइफनहरू ।

2.4 रिटर्न मान विवरण (JSON)

पहिचान इन्टरफेसले मानक JSON ढाँचा फर्काउँछ। मान हो null फाँट स्वचालित रूपमा हटाइन्छ ।

माथि-स्तर फाँटहरू

फाँट प्रकार वर्णन
id String यस अनुरोधको अद्वितीय ब्याच आईडी (UUID ढाँचा) परिणामहरू अतुल्यकालिक रूपमा क्वेरी गर्न प्रयोग गर्न सकिन्छ।
ocrType Int अनुरोध परामितिहरूसँग, प्रकार पहिचान गर्नुहोस् type पत्राचार[सम्पादन गर्ने]
processId Int अनुरोध ह्यान्डल गर्ने इन्जिन नोडको आईडी ।
processName String इन्जिन नामहरू प्रक्रिया गर्नुहोस् । जब खाली यसले संकेत गर्दछ कि पहिचान समय समाप्त भयो वा नोडमा मानाङ्कन गरिएको थिएन।
state Int स्थिति कोडहरू ह्यान्डल गर्नुहोस् (तल गणना तालिका हेर्नुहोस्)।
message String अतिरिक्त सन्देश/त्रुटि वर्णन, जुन अपवादात्मक अवस्थामा मात्र फर्काइन्छ ।
result Object कोर पहिचान परिणाम वस्तुहरू (विवरणहरूको लागि तलको सबफिल्ड तालिका हेर्नुहोस्)।
desc String इन्जिनमा संलग्न अतिरिक्त वर्णनात्मक जानकारी, यदि कुनै छ भने।

result उप-वस्तु - पाठ परिणाम

फाँट प्रकार वर्णन
autoText String सिफारिस गरिएको प्रयोग。 बुद्धिमान अनुच्छेद मर्जिंग र लेआउट अप्टिमाइजेसनको साथ पाठ पूरा गर्नुहोस्।
spiltText String मौलिक अनुच्छेदद्वारा पाठ विभाजन (अनुच्छेदहरू बीचमा) \t इन्डेन्ट + \n लाइन ब्रेक)। तालिका मोडमा, डेटा JSON स्तम्भहरू हुन्।
transText String परिणाम पाठ (यसमा मात्र) अनुवाद गर्नुहोस् प्रकार=अनुवाद मोडले फर्काउँछ, यससँग संरचना spiltText पत्राचार)।
lang String छवि भाषा पहिचायक स्वचालित रूपमा इन्जिनद्वारा पत्ता लगाइन्छ (उदाहरणका लागि chi_sim, eng, jpn)。
resultType Int नतिजा ढाँचाको प्रकार[सम्पादन गर्ने]0= सादा पाठ, 1= वेब पृष्ठ (सूत्र रेन्डरिंगको साथ), 2= तालिका।

result उप-वस्तु - समन्वय स्थिति डेटा 🗺️

निम्न फाँटहरूले मौलिक छविमा प्रत्येक पाठ खण्डको सटीक स्थिति समावेश गर्दछ, परिदृश्यहरूको लागि उपयुक्त जस्तै हाइलाइट ओभरले, क्षेत्र निकासी, आदि।

फाँट प्रकार वर्णन
spiltLocText String समन्वय जानकारीको साथ मूल खण्डित पाठ (स्मार्ट अनुच्छेद मर्जको परिणाम, स्थान जानकारी सहित)।
transLocText String समन्वय सूचनासँग विभाजित पाठ अनुवाद गरियो ।
verticalText String (JSON) ⭐ एउटा पूर्ण पाठ खण्ड समन्वय एरेको JSON स्ट्रिङ । हरेक तत्वका लागि एउटा TextCellInfo वस्तु (तल संरचना हेर्नुहोस्)।

verticalText पाठ कक्ष सूचना वस्तु संरचना

[
  {
    "words": "पहिचान गरिएको पाठ सामाग्री",
    "trans": "अनुवाद परिणाम (यदि कुनै भएमा)",
    "pageIndex": 0,
    "location": {
      "left": 120.0,
      "top": 45.0,
      "width": 230.0,
      "height": 28.0
    }
  },
  ...
]
फाँट प्रकार वर्णन
words String यो पाठ खण्डद्वारा पहिचान गरिएको पाठ ।
trans String अनुवाद परिणामहरू (अनुवाद मोडमा मात्र मूल्यवान)।
pageIndex Int पृष्ठ सङ्ख्या अनुक्रमणिका (० बाट सुरु भएर, बहु-पृष्ठ कागजात परिदृश्यहरूमा वैध) ।
location.left Double पाठ खण्डको माथिल्लो बायाँ कुनामा एक्स समकक्ष (पिक्सेल) ।
location.top Double पाठ खण्डको माथिल्लो बायाँ कुनामा वाई समकक्ष (पिक्सेल) ।
location.width Double पाठ खण्डको चौडाइ (पिक्सेलमा) ।
location.height Double पाठ खण्डको उचाइ (पिक्सेलमा) ।

result उप-वस्तु - फाइल डाउनलोड गर्नुहोस्

फाँट प्रकार वर्णन
viewUrl String जब resultType=1 (वेबपृष्ठ / सूत्र), अनलाइन पूर्वावलोकन पृष्ठ ठेगाना फर्काइयो।
downloadHtml String डाउनलोड लिङ्कहरूको साथ HTML स्निपेट।
files Array डाउनलोडको लागि उपलब्ध परिणाम फाइलहरूको सूची, जसमध्ये प्रत्येक हो: DownLoadInfo वस्तु (तल संरचना हेर्नुहोस्)।

files डाउनलोडजानकारी वस्तु संरचनामा डाउनलोडजानकारी वस्तु संरचना

फाँट प्रकार वर्णन
url String फाइल डाउनलोड ठेगाना ।
param String तपाइँलाई आवश्यक अतिरिक्त प्यारामिटरहरू डाउनलोड गर्नुहोस्।
fileType Int फाइल प्रकार गणना:1=PDF, 2=Word, 3=PPT, 4=Excel, 5=TXT, 6=Markdown
desc String कागजात वर्णन ।

state राज्य गणना

मान अर्थ[सम्पादन गर्ने] वर्णन
0 विचाराधिन छ अनुरोध प्राप्त भएको छ र इन्जिन असाइन गरिएको छैन।
2 सफल प्रक्रिया सामान्य रूपमा पहिचान परिणामहरू फर्काउनुहोस्।
3 प्रक्रिया असफल भयो इन्जिनले एक अपवाद ह्यान्डल गर्दछ र पुन: प्रयास गर्न सकिन्छ।
4 प्रक्रिया समय समाप्ति इन्जिन वैधता अवधि भित्र फिर्ता भएन।
6 कन्करेन्सी सीमा त्यहाँ धेरै समवर्ती अनुरोधहरू छन्, त्यसैले कृपया आवृत्ति घटाउनुहोस्।
7 प्रकारहरू समर्थित छैनन् हालको पहिचान प्रकार वा फाइल ढाँचा समर्थित छैन ।

पछाडिको उदाहरण

✅ सफल प्रतिक्रिया (समन्वय डेटाको साथ):

{
  "ocrType": 0,
  "id": "a1b2c3d4-e5f6-7890-abcd-ef1234567890",
  "processId": 3,
  "processName": "OCR-Node-01",
  "state": 2,
  "result": {
    "autoText": "छरितो गाभ्ने पछि पाठ पूरा गर्नुहोस्",
    "spiltText": "अनुच्छेदद्वारा विभाजित मौलिक पाठ",
    "verticalText": "[{\"words\":\"नमस्ते\",\"location\":{\"left\":10,\"top\":20,\"width\":80,\"height\":22}}]",
    "resultType": 0,
    "lang": "chi_sim"
  }
}

❌ त्रुटि/सिमित प्रतिक्रिया:

{
  "ocrType": 0,
  "processName": "सुझावहरू",
  "result": {
    "spiltText": "आजको एपीआई कोटा समाप्त भएको छ, कृपया रिचार्ज गर्नुहोस् र यसलाई प्रयोग गर्न जारी राख्नुहोस्!",
    "autoText": "आजको एपीआई कोटा समाप्त भएको छ, कृपया रिचार्ज गर्नुहोस् र यसलाई प्रयोग गर्न जारी राख्नुहोस्!"
  },
  "id": 1
}
3. एसिन्क्रोनस परिणाम क्वेरी (op = idcode)

यूआरएल अनुरोध गर्नुहोस्: /Code.ashx?op=idcode&app=api&token=YOUR_TOKEN

कल गर्ने तरिका: POST

प्रकार्य: पहिचान इन्टरफेस अनुसार फर्काइयो id एसिन्क्रोनस प्रक्रियाको नतिजा क्वेरी गर्नुहोस् । जब पहिचान इन्टरफेस फर्कन्छ state=0(पेन्डिङ), तपाईं अन्तिम परिणाम प्राप्त गर्न मतदान गर्न यो इन्टरफेस प्रयोग गर्न सक्नुहुनेछ।

परिमिति नाम आवश्यक छ प्रकार वर्णन
id हो String इन्टरफेस द्वारा फिर्ता गरिएको ब्याच अनुरोध आईडी पहिचान गर्नुहोस् र यसलाई पोष्ट बडी मार्फत पास गर्नुहोस्।

पछाडिको उदाहरण

✅ सफल प्रतिक्रिया:

[
  {
    "ocrType": 0,
    "id": "a1b2c3d4-...",
    "processName": "OCR-Node-01",
    "state": 2,
    "result": {
      "autoText": "परिणाम पाठ पहिचान गर्नुहोस्",
      "spiltText": "विभाजन गरिएको पाठ",
      "resultType": 0
    }
  }
]

❌ असफल प्रतिक्रिया (आईडी अवस्थित छैन वा परिणामको म्याद समाप्त भएको छ):

no

सादा पाठ फर्काउँदछ no आईडी हुन सक्छ, त्यो आईडीका लागि कुनै परिणाम फेला परेन भनेर सङ्केत गर्दछ त्रुटि वा परिणामको म्याद समाप्त भएको छ र खाली गरिएको छ ।

4. छवि अपलोड बेड (op = imgUpload)

यूआरएल अनुरोध गर्नुहोस्: /Code.ashx?op=imgUpload&app=api&token=YOUR_TOKEN

कल गर्ने तरिका: POST (multipart/form-data)

प्रकार्य: नि: शुल्क छवि ओछ्यानमा एक छवि अपलोड गर्नुहोस् र सार्वजनिक नेटवर्कमा पहुँचयोग्य सीधा लिङ्क URL फर्काउनुहोस्। यो परिदृश्यहरूको लागि उपयुक्त छ जहाँ तपाईंले पहिले छवि अपलोड गर्न आवश्यक छ र त्यसपछि पहिचान इन्टरफेस कल गर्न URL प्रयोग गर्नुहोस्।

परिमिति नाम आवश्यक छ प्रकार वर्णन
(कागजात) हो File छवि फाइलहरू बहु-भाग फेसनमा अपलोड गरियो।

पछाडिको उदाहरण

✅ सफल प्रतिक्रिया:

https://cdn.example.com/uploads/abc123.jpg

❌ असफल प्रतिक्रिया (फाइल अपलोड गरिएको छैन वा अपवाद अपलोड गरिएको छैन):

no

सादा पाठ फर्काउँदछ no अपलोड प्रक्रिया गर्दा फाइल प्राप्त नभएको वा अपवाद उत्पन्न भएको इङ्गित गर्दछ ।

5. ब्यालेन्स इन्क्वायरी इन्टरफेस (एपीआई कोटा)

यूआरएल अनुरोध गर्नुहोस्: /Code.aspx?op=count&app=api&token=YOUR_TOKEN

कल गर्ने तरिका: GET

यस इन्टरफेस मार्फत, तपाईं आज टोकन प्रयोग गरिएको संख्या र बाँकी कोटा हेर्न सक्नुहुन्छ।

पछाडिको उदाहरण

✅ सफल प्रतिक्रिया:

{
  "Account": "api",
  "TodayCount": 52, // आज प्रयोग गरिन्छ"LimitCount": 9948       // हालको बाँकी रहेको जम्मा सङ्ख्या
}

❌ असफलता प्रतिक्रिया (अवैध वा प्रसारित नगरिएको टोकन):

{
  "Account": "api",
  "TodayCount": 0,
  "LimitCount": 0
}

नोट: यदि टोकन अमान्य छ भने, कुनै त्रुटि रिपोर्ट गरिने छैन, तर लिमिटकाउन्ट हो वा होइन भन्ने आधारमा JSON लाई ० को सबै मानहरूसँग फर्काउनेछ 0 टोकनको वैधता न्याय गर्न।

💻 अनलाइन कमिसनिङ & पहुँच सङ्केत
// अनुरोध पठाउनका लागि प्रतिक्षा गर्नुहोस्...
📋 छिटो पहुँच सङ्केत (स्वचालित रूपमा उत्पन्न गर्न माथिका विकल्पहरू अनुसरण गर्नुहोस्)
Code Snippet
इन्टरफेस र परिमिति चयन गरेपछि, यो स्वचालित रूपमा उत्पन्न हुनेछ...
OCR सहायक QQ अनलाइन ग्राहक सेवा
QQ ग्राहक सेवा(365833440)
OCR सहायक QQ प्रयोगकर्ता सञ्चार समूह
QQसमूह(100029010)
ओसीआर सहायकले ईमेल द्वारा ग्राहक सेवालाई सम्पर्क गर्नुहोस्
पत्रमञ्जूषा:net10010@qq.com

तपाईंको टिप्पणी र सुझावहरूको लागि धन्यवाद!