【ගැඹුරු ඉගෙනුම් OCR ශ්රේණි · 8】 පෙළ හඳුනා ඇල්ගොරිතම පිළිබඳ සවිස්තරාත්මක පැහැදිලි කිරීමක්
📅
පශ්චාත් කාලය: 2025-08-19
👁️
කියවීම:2267
⏱️
ආසන්න වශයෙන්. මිනිත්තු 24 (4764 වචන)
📁
වර්ගය: උසස් මාර්ගෝපදේශ
EAST, DBNet සහ PSENet වැනි ප් රධාන ධාරාවේ හඳුනාගැනීමේ ක් රම ඇතුළුව පෙළ හඳුනාගැනීමේ ඇල්ගොරිතම පිළිබඳ සවිස්තරාත්මක හැඳින්වීම. සංකීර්ණ දර්ශනවල පෙළ ප් රදේශ නිවැරදිව සොයා ගන්නේ කෙසේදැයි සොයා බලන්න.
## හැඳින්වීම
පෙළ හඳුනා ගැනීම යනු OCR පද්ධතිවල පළමු හා තීරණාත්මක පියවරයි. එහි මෙහෙවර වන්නේ රූප තුළ පෙළ ප් රදේශ නිවැරදිව සොයා ගැනීමයි, පසුකාලීන පෙළ හඳුනා ගැනීම සඳහා නිශ්චිත ආදාන ලබා දීමයි. ගැඹුරු ඉගෙනුම් තාක්ෂණයේ වර්ධනයත් සමඟ, පෙළ හඳුනාගැනීමේ ඇල්ගොරිතම සාම්ප් රදායික ක් රමවල සිට ගැඹුරු ඉගෙනුම් ක් රම දක්වා සැලකිය යුතු පරිවර්තනයකට භාජනය වී ඇත. මෙම ලිපිය EAST, DBNet, PSENet ආදිය ඇතුළුව ප් රධාන ධාරාවේ පෙළ හඳුනාගැනීමේ ඇල්ගොරිතම ගැන සොයා බලන අතර ඒවායේ නිර්මාණ මූලධර්ම, තාක්ෂණික ලක්ෂණ සහ යෙදුම් අවස්ථා විශ්ලේෂණය කරනු ඇත.
## පෙළ හඳුනා ගැනීමේ අභියෝග
### දර්ශන සංකීර්ණත්වය
සැබෑ ලෝකයේ පෙළ හඳුනා ගැනීම බොහෝ අභියෝගයන්ට මුහුණ දෙයි:
** ජ්යාමිතික විරූපණය**:
- ඉදිරිදර්ශන විකෘතිය: වෙඩි තැබීමේ කෝණ හේතුවෙන් ජ් යාමිතික විකෘතිය
- වක්ර පෙළ: දැන්වීම් පුවරු සහ බෝතල් වැනි වක්ර මතුපිට පෙළ
- පෙළ භ් රමණය කරන්න: ඕනෑම කෝණයකින් පෙළ සකස් කරන්න
- පරිමාණ විචලනය: විවිධ දුර නිසා පෙළ ප් රමාණයේ වෙනස්කම්
**දෘශ් ය අවධානය වෙනතකට යොමු කිරීම් **:
- සංකීර්ණ පසුබිම්: පෙළ සහ පසුබිම වර්ණයෙන් හා වයනයෙන් සමාන වේ
- ආලෝකකරණ වෙනස්කම්: දීප්තිමත් ආලෝකය, සෙවනැලි, පරාවර්තන වැනි බලපෑම්
- බොඳවීම සහ ශබ්දය: චලන බොඳවීම, සාවද් ය අවධානය, රූප ශබ්දය
- අවහිරතා ගැටළු: සමහර පෙළ වෙනත් වස්තූන් විසින් අපැහැදිලි වේ
**පෙළ විවිධත්වය **:
- බහුභාෂා මිශ් රණය: චීන, ඉංග් රීසි, අරාබි සහ වෙනත් විවිධ භාෂා
- අකුරු වෙනස්කම්: මුද් රණය, අත් අකුරු සහ කලාත්මක අකුරු
- ඝන සැකැස්ම: කුඩා රේඛා පරතරය සහ දැඩි අක්ෂර
- බහු-දිශානතිය: තිරස්, සිරස්, ඇලවීම, ආදිය විවිධ දිශාවන්ට
### තාක්ෂණික අවශ් යතා
** නිරවද්යතා අවශ්යතා **:
- ඉහළ මතකයක්: පෙළ ප් රදේශ අතපසු කළ නොහැක
- ඉහළ නිරවද්යතාව: පෙළ නොවන ප්රදේශ වැරදි ලෙස හඳුනා ගැනීමෙන් වළකින්න
- මායිම් නිරවද්යතාව: පාඨයේ මායිම් නිවැරදිව සොයා ගන්න
** කාර්යක්ෂමතා අවශ්යතා **:
- තත් ය කාලීන සැකසුම්: ජංගම යෙදුම් ප් රතිචාර දැක්විය යුතුය
- සම්පත් සීමාවන්: ජංගම උපාංග සඳහා පරිගණක සහ මතක සීමාවන්
- කණ්ඩායම සැකසීම: මහා පරිමාණ ලේඛන කාර්යක්ෂමව සැකසීම
## සාම්ප් රදායික පෙළ හඳුනාගැනීමේ ක් රම
### සම්බන්ධිත සංරචක මත පදනම් වූ ප්රවේශය
** MSER (උපරිම ස්ථාවර අන්ත ප්රදේශ) **:
- මූලධර්මය: රූපයේ ස්ථාවර ආන්තික ප් රදේශ සොයන්න
- වාසි: ආලෝකකරණ වෙනස්කම් සඳහා ශක්තිමත්, ඉහළ පරිගණකමය කාර්යක්ෂමතාව
- අවාසි: සංකීර්ණ පසුබිම් වලට සංවේදී, අඩු ප් රතිවිරුද්ධ පෙළ හැසිරවීමට අපහසු
** SWT (ආඝාතය පළල පරිවර්තනය) **:
- මූලධර්මය: ආඝාතයේ පළල මත පදනම්ව අනුකූලතා හඳුනාගැනීමේ පෙළ
- කිහිප දෙනකුගේ හොඳ: අකුරු වෙනස්කම් වලට අනුවර්තනය විය හැකිය
- අවාසි: පරාමිතීන්ට සංවේදී, ශබ්දයට සංවේදී
### කවුළුව මත පදනම් වූ ප්රවේශය ලිස්සා
** බහු-පරිමාණ හඳුනා ගැනීම **:
- විවිධ ප්රමාණවල ලිස්සා කවුළු භාවිතා කරන්න
- HOG සහ LBP වැනි අත්පොත ලක්ෂණ ඒකාබද්ධ කරයි
- එය පෙළද නැද්ද යන්න තීරණය කිරීම සඳහා SVM වැනි වර්ගීකරණ භාවිතා කරන්න
** වාසි සහ අවාසි විශ්ලේෂණය **:
- කිහිප දෙනකුගේ හොඳ: සරල සංකල්පය සහ ක් රියාත්මක කිරීමට පහසුය
- අවාසි: ඉහළ පරිගණකමය සංකීර්ණත්වය, අත්තනෝමතික හැඩැති පෙළ හැසිරවීමට අපහසු
## ගැඹුරු ඉගෙනුම් පෙළ හඳුනාගැනීමේ ඇල්ගොරිතම
### නැගෙනහිර ඇල්ගොරිතම පිළිබඳ සවිස්තරාත්මක පැහැදිලි කිරීමක්
EAST (කාර්යක්ෂම හා නිවැරදි දර්ශන පෙළ අනාවරකය) යනු 2017 දී යෝජනා කරන ලද කාර්යක්ෂම පෙළ හඳුනාගැනීමේ ඇල්ගොරිතමයකි.
**මූලික අදහස **:
- පෙළ ප් රදේශවල සෘජු පුරෝකථනය: සංකීර්ණ පශ්චාත් සැකසුම් පියවර වළකින්න
- බහු-පරිමාණ විශේෂාංග විලයනය: විශේෂාංග තොරතුරු විවිධ මට්ටම් ඒකාබද්ධ කරන්න
- ජ්යාමිතිය පුරෝකථනය: භ්රමණය වන සෘජුකෝණාස්රය සහ ක්වාඩ් හඳුනා ගැනීමට සහාය දක්වයි
**ජාල ගෘහ නිර්මාණ ශිල්පය **:
**1. විශේෂාංග නිස්සාරණ ජාලය **:
- කොඳු නාරටිය ජාලය: PVANet හෝ ResNet
- විශේෂාංග පිරමීඩය: බහු-පරිමාණ ලක්ෂණ ඇතුළත් වේ
- උඩු යටිකුරු කිරීම: විශේෂාංග සිතියම් විභේදනය යථා තත්වයට පත් කිරීම
**2. අනාවැකි ශාඛාව **:
- ලකුණු ප් රස්ථාරය: එක් එක් පික්සල් පෙළට අයත් වීමේ සම්භාවිතාව පුරෝකථනය කරයි
- ජ්යාමිතිය: පෙළ ප්රදේශයේ ජ්යාමිතික පරාමිතීන් පුරෝකථනය කරයි
** ජ්යාමිතික පරාමිතික පුරෝකථනය **:
** භ්රමණය සෘජුකෝණාස්රය මාදිලිය **:
- 4 දුර අගයන්: සෘජුකෝණාස්රයේ හතර පැත්තට ඇති දුර
- 1 කෝණ අගය: සෘජුකෝණාස්රයේ භ් රමණ කෝණය
**Quad මාදිලිය**:
- 8 ඛණ්ඩාංක අගයන්: චතුරස්රයේ සිරස් හතරේ ඛණ්ඩාංක පියවා ගැනීම
** අඞු කිරීමට කාර්යභාරය නිර්මාණ **:
** රහසිගත පාඩු **:
පන්ති සමතුලිතතාවය භාවිතා කරමින් හරස් එන්ට්රොපිය අලාභය:
L_cls = -β * y * log(ŷ) - (1-β) * (1-y) * ලඝු-සටහන(1-ŷ)
** ප් රතිගාමී අලාභය **:
IoU පාඩුව සහ සුමට L1 පාඩු සංයෝජනයක් භාවිතා කිරීම:
L_geo = L_IoU + λ * L_smooth_L1
** පශ්චාත්-සැකසීම **:
- එළිපත්ත: ලකුණු ප්රස්ථාරය මත පදනම්ව අපේක්ෂක ප්රදේශ උත්පාදනය කරන්න
- එන්එම්එස්: පුනරාවර්තන තක්සේරු ඉවත් කිරීමේ උපරිම නොවන නිෂේධනය
- ජ්යාමිතික සීමාවන්: අතාර්කික ජ්යාමිතීන් පෙරීම
### DBNet ඇල්ගොරිතම පිළිබඳ සවිස්තරාත්මක පැහැදිලි කිරීමක්
DBNet (විකලනය කළ හැකි ද්විකරණ ජාලය) යනු 2020 දී යෝජනා කරන ලද තත් ය කාලීන පෙළ හඳුනාගැනීමේ ඇල්ගොරිතමයකි.
** මූලික නවෝත්පාදනය**:
- විකලනය කළ හැකි ද්විකරණය: ද්විනාරීකරණ ක් රියාවලිය ජාලයට ඒකාබද්ධ කරයි
- අනුවර්තන එළිපත්ත: එක් එක් පික්සල් සඳහා ප් රශස්ත එළිපත්ත ඉගෙන ගනී
- සරල පශ්චාත් සැකසුම්: පශ්චාත් සැකසීමේ සංකීර්ණත්වය අඩු කරයි
**ජාල ගෘහ නිර්මාණ ශිල්පය **:
**1. කොඳු නාරටිය ජාලය **:
- ResNet-18/50: විශේෂාංග නිස්සාරණය
- FPN: විශේෂාංග පිරමීඩ ජාලය
- උඩුගත කිරීම: මුල් රූපයේ 1/4 විභේදනයට ආපසු යන්න
**2. අනාවැකි ප්රධානී **:
- සම්භාවිතාව ප්රස්ථාරය P: පෙළ ප්රදේශ සම්භාවිතාව
- එළිපත්ත ප් රස්ථාරය T: අනුවර්තී ද්විනාරීකරණ එළිපත්ත
- ද්විමය රූපය B: අවසාන ද්විකරණ ප්රතිඵලය
** අවකලනය කළ හැකි ද්විනාසිකරණය **:
** සම්මත ද්විනාසිකරණය **:
B = 1 P > T වෙන 0 නම්
** අවකලනය දළ වශයෙන් **:
B = 1 / (1 + exp(-k* (P-T)))
එහිදී k යනු විස්තාරණ සාධකය වන අතර ශ් රිතය පියවර ශ් රිතයට සමීප කරයි.
** අඞු කිරීමට ක්රියාකාරිත්වය **:
**සම්පූර්ණ පාඩු **:
L = L_cls + α * L_dis + β * L_thresh
- L_cls: වර්ගීකරණ අලාභය (ද්විමය හරස් එන්ට් රොපිය)
- L_dis: දුර පාඩුව (දාදු කැටය නැතිවීම)
- L_thresh: එළිපත්ත අලාභය (L1 පාඩුව)
**පුහුණු උපාය මාර්ග **:
- දුෂ්කර නියැදි පතල් කැණීම්: වර්ගීකරණය කිරීමට අපහසු පික්සල් කෙරෙහි අවධානය යොමු කරන්න
- දත්ත වැඩි දියුණු කිරීම: භ් රමණය, පරිමාණය, වර්ණ පරිවර්තනය
- බහු පරිමාණ පුහුණුව: විවිධ ප් රමාණයේ පෙළට අනුවර්තනය වීමේ හැකියාව වැඩි දියුණු කරයි
### PSENet ඇල්ගොරිතම පිළිබඳ සවිස්තරාත්මක පැහැදිලි කිරීමක්
PSENet (ප්රගතිශීලී පරිමාණ පුළුල් ජාලය) විශේෂයෙන් නිර්මාණය කර ඇත්තේ අත්තනෝමතික හැඩැති පෙළ හඳුනා ගැනීම සඳහා ය.
**මූලික අදහස **:
- ප් රගතිශීලී ව් යාප්තිය: ක් රමයෙන් කුඩා කර්නල් සිට සම්පූර්ණ පෙළ ප් රදේශ දක්වා ව් යාප්ත වන්න
- බහු පරිමාණ කර්නල්: විවිධ ප්රමාණයේ පෙළ හර උත්පාදනය කරන්න
- පික්සල් ඒකරාශී කිරීම: පික්සල් මට්ටමේ ඒකරාශී කිරීම හරහා පෙළ අවස්ථා ප් රතිනිර්මාණය කරන්න
**ජාල ගෘහ නිර්මාණ ශිල්පය **:
**1. විශේෂාංග නිස්සාරණය **:
- රෙස්නෙට් කොඳු නාරටිය ජාලය
- FPN විශේෂාංග විලයනය
- බහු පුරෝකථන ශාඛා
**2. බහු පරිමාණ අනාවැකි **:
විවිධ පරිමාණයන් n ඛණ්ඩනය බිම් කොටස් උත්පාදනය:
- S1: අවම කර්නලය (පෙළ මධ් යස්ථාන ප් රදේශය)
- S2, S3, ..., Sn: ක් රමයෙන් න් යෂ්ටිය ප් රසාරණය කිරීම
- Sn: සම්පූර්ණ පෙළ ප් රදේශය
** ප්රගතිශීලී පරිමාණ ඇල්ගොරිතම **:
**1. ආරම්භය **:
- කුඩාම හරය S1 සමඟ ආරම්භ කරන්න
- පෙළ අවස්ථා ලබා ගැනීම සඳහා සම්බන්ධතා සංරචක විශ්ලේෂණය භාවිතා කරන්න
**2. පුනරාවර්තන පුළුල් කිරීම**:
පරාසය තුළ I සඳහා (2, N + 1):
එක් එක් පෙළ උදාහරණය සඳහා:
Si හි යාබද පික්සල් සොයන්න
යාබද පික්සල් වත්මන් උදාහරණයට ඒකාබද්ධ කරන්න
උදාහරණ මායිම් යාවත්කාලීන කරන්න
**3. අවසන් කිරීමේ කොන්දේසි **:
- උපරිම පරිමාණ Sn ළඟා
- නැතහොත් දිගටම පුළුල් කළ නොහැක
** අඞු කිරීමට ක්රියාකාරිත්වය **:
**සම්පූර්ණ අලාභය **:
L = Σ(i = 1 සිට n දක්වා) λi * L_seg(Si, Gi)
ඒ අතර:
- L_seg: බෙදීම් අලාභය (දාදු කැටය පාඩුව + හරස් එන්ට් රොපිය අලාභය)
- ගි: ith පරිමාණයේ සත් ය ලේබලය
- λi: විවිධ පරිමාණයන්හි බර
### පික්සල්ලින්ක් ඇල්ගොරිතම
පික්සල් ලින්ක් පික්සල් අතර සම්බන්ධතාවය පුරෝකථනය කිරීමෙන් පෙළ හඳුනා ගනී.
**මූලික අදහස **:
- පික්සල් වර්ගීකරණය: එක් එක් පික්සල් පෙළට අයත් දැයි තීරණය කරන්න
- සම්බන්ධතා පුරෝකථනය: යාබද පික්සල් අතර සම්බන්ධතාවය පුරෝකථනය කරන්න
- උදාහරණ ඛණ්ඩනය: සම්බන්ධතා සම්බන්ධතා හරහා පෙළ අවස්ථා සෑදීම සඳහා සමස්ත පික්සල්
** ජාල නිර්මාණය **:
**1. පෙළ / පෙළ නොවන අනාවැකි **:
- ද්විමය වර්ගීකරණ කාර්යයන්
- පික්සල් අනුව ප් රතිදාන පෙළ සම්භාවිතාව
**2. සම්බන්ධතා අනාවැකිය **:
- 8 දිශාවන් සම්බන්ධතා අනාවැකිය
- එක් එක් දිශාව සඳහා ප්රතිදාන සම්බන්ධතාවය සම්භාවිතාව
** පශ්චාත්-සැකසුම් ඇල්ගොරිතම **:
**1. පික්සල් පෙරහන් **:
- පෙළ සම්භාවිතාව මත පදනම්ව පික්සල් පෙරහන් කරන්න
- ඉහළ විශ්වාසනීය පෙළ පික්සල් රඳවා ගන්න
**2. සම්බන්ධතා ඒකරාශී කිරීම **:
- ඇල්ගොරිතම භාවිතා කර බලන්න
- සම්බන්ධතා සබඳතා මත පදනම්ව පික්සල් ඒකාබද්ධ කරන්න
- ආකෘති පත්රය සම්බන්ධ පෙළ අවස්ථා
## ප්රමිතික සහ මිණුම් දණ්ඩ දත්ත කාණ්ඩ ඇගයීමට ලක් කරන්න
### ප්රමිතික ඇගයීම
** හඳුනාගැනීමේ මට්ටමේ දර්ශක **:
- නිරවද්යතාව: පෙළ ප්රදේශවල නිවැරදි අනුපාතය හඳුනා ගනී
- මතක තබා ගැනීම: නිවැරදිව හඳුනාගත් සැබෑ පෙළ ප් රදේශවල අනුපාතය
- F1 ලකුණු: නිරවද් යතාවයේ සහ මතකයේ සුසංයෝගී සාමාන් යය
** පික්සල් මට්ටමේ ප් රමිතික **:
- පික්සල් නිරවද් යතාව: නිසි ලෙස වර්ගීකරණය කර ඇති පික්සල් ප් රතිශතය
- පික්සල් නැවත කැඳවීම: නිවැරදිව වර්ගීකරණය කර ඇති පෙළ පික්සල් ප් රතිශතය
- IoU: පුරෝකථන ප් රදේශයේ සැබෑ ප් රදේශයට අනුපාතය
### මිණුම් දත්තය දත්ත සමුදාය
** ICDAR ශ් රේණිය **:
- ICDAR 2013: අවධානය යොමු කළ තිරස් පෙළ හඳුනා ගැනීම
- ICDAR 2015: බහු-දිශා පෙළ අඩංගු වේ
- ICDAR 2017: බහුභාෂා පෙළ හඳුනා ගැනීම
** වෙනත් වැදගත් දත්ත කට්ටල **:
- MSRA-TD500: බහු-දිශානුරූපී දිගු පෙළ රේඛා
- කොකෝ-පෙළ: ස්වාභාවික දර්ශනවල පෙළ
- මුළු-පෙළ: වක්ර පෙළ හඳුනා ගැනීම
- CTW1500: අත්තනෝමතික හැඩැති පෙළ
## ප්රායෝගික අයදුම් සලකා බැලීම්
### කාර්ය සාධන ප්රශස්තිකරණය
** ආදර්ශ සම්පීඩනය **:
- දැනුම ආසවනය: කුඩා ආකෘති සමඟ විශාල ආකෘති ඉගෙන ගන්න
- ආදර්ශ කප්පාදු කිරීම: වැදගත් නොවන සම්බන්ධතා ඉවත් කරන්න
- ප් රමාණකරණය: සංඛ් යාත්මක නිරවද් යතාවය අඩු කරයි
** අනුමාන ත්වරණය **:
- ටෙන්සර්ආර්ටී: එන්වීඩියා ජීපීයූ ත්වරණය
- OpenVINO: ඉන්ටෙල් දෘඩාංග ප් රශස්තිකරණය
- ජංගම ප් රශස්තිකරණය: ARM ප් රොසෙසර සඳහා ප් රශස්තිකරණය කර ඇත
### යෙදවුම් උපාය මාර්ග
** වලාකුළු යෙදවීම **:
- ඉහළ නිරවද්යතාව ආකෘති: සංකීර්ණ ජාල ව්යුහයන් භාවිතා කරන්න
- කණ්ඩායම සැකසීම: ප් රතිදානය වැඩි කරයි
- ඉලාස්ටික් පරිමාණය: බර මත පදනම්ව ස්වයංක් රීයව පරිමාණය කිරීම
** එජ් යෙදවීම **:
- සැහැල්ලු ආකෘති: සමබර නිරවද්යතාව සහ කාර්යක්ෂමතාව
- තත් ය කාලීන සැකසුම්: අඩු ප් රමාද අවශ් යතා
- නොබැඳි වැඩ කරයි: අන්තර්ජාල සම්බන්ධතාවයක් අවශ් ය නොවේ
## අනාගත සංවර්ධන ප් රවණතා
### තාක්ෂණික සංවර්ධන දිශාව
**බහු මාදිලි විලයනය **:
- භාෂා ආකෘති ඇතුළත් කිරීම: පෙළ අර්ථ විචාර තොරතුරු උපයෝගී කර ගැනීම
- බහු-සංවේදක විලයනය: ගැඹුර, අධෝරක්ත ආදිය වැනි තොරතුරු ඒකාබද්ධ කරයි
- කාල තොරතුරු: වීඩියෝවල කාල සබඳතා භාවිතා කරන්න
** අනුවර්තී හඳුනා ගැනීම **:
- වසම් අනුවර්තනය: විවිධ අවස්ථාවන් සහ දත්ත බෙදාහැරීම් වලට අනුවර්තනය වේ
- අඩු වෙඩි ඉගෙනීම: නව පෙළ වර්ග වලට ඉක්මනින් අනුවර්තනය වන්න
- මාර්ගගත ඉගෙනීම: පරිශීලක ප් රතිපෝෂණය මත පදනම්ව අඛණ්ඩ වැඩිදියුණු කිරීම
**අවසානයේ සිට අවසානය දක්වා ප්රශස්තිකරණය **:
- හඳුනා ගැනීම සහ හඳුනා ගැනීම: හඳුනා ගැනීම සහ හඳුනා ගැනීම ඒකාබද්ධ ප් රශස්තිකරණය
- බහු කාර්ය ඉගෙනීම: එකවර බහුවිධ ආශ්රිත කාර්යයන්හි නිරත වන්න
- ස්නායු ගෘහ නිර්මාණ ශිල්පය සෙවීම: ප් රශස්ත ජාල ව් යුහය ස්වයංක් රීයව නිර්මාණය කරන්න
### යෙදුම් පුළුල් කිරීම
**නැගී එන අවස්ථා **:
- AR / VR: වැඩිදියුණු කළ යථාර්ථයේ පෙළ හඳුනා ගැනීම
- ස්වාධීන රිය පැදවීම: රථවාහන සංඥා සහ වීදි සංඥා හඳුනා ගැනීම
- කාර්මික පරීක්ෂාව: නිෂ්පාදන ලේබල් කිරීම සහ තත්ත්ව පාලනය
** හරස් වසම් යෙදුම් **:
- වෛද් ය රූප: වෛද් ය වාර්තා සහ වාර්තා වලින් පෙළ
- දුරස්ථ සංවේදක ඡායාරූප: චන්ද් රිකා ඡායාරූපවල ස්ථාන නාම හඳුනා ගැනීම
- ඓතිහාසික ලේඛන: පුරාණ පොත් සහ අත්පිටපත් ඩිජිටල්කරණය කිරීම
## සාරාංශය
OCR පද්ධතිවල ප් රධාන අංගයක් ලෙස පෙළ හඳුනා ගැනීම ගැඹුරු ඉගෙනුම් යුගයේ සැලකිය යුතු ප් රගතියක් ලබා ඇත. EAST කාර්යක්ෂමව හඳුනා ගැනීමේ සිට DBNet හි තත් ය කාලීන සැකසීම දක්වා PSENet හි අත්තනෝමතික හැඩය හඳුනා ගැනීම දක්වා, සෑම ඇල්ගොරිතමයකටම තමන්ගේම අද්විතීය වාසි සහ අදාළ අවස්ථා ඇත.
** ප්රධාන තාක්ෂණික කරුණු **:
- බහු-පරිමාණ විශේෂාංග විලයනය: විවිධ ප්රමාණවල පෙළ හසුරුවයි
- ජ්යාමිතික ආකෘති නිර්මාණය: අත්තනෝමතික හැඩයන් පෙළ හඳුනා ගැනීමට සහාය වේ
- අවසානයේ සිට අවසානය දක්වා ප් රශස්තිකරණය: පද්ධති සැලසුම් සහ පුහුණු ක් රියාවලීන් විධිමත් කිරීම
- තත් ය කාලීන සලකා බැලීම්: නිරවද් යතාවයේ සහ කාර්යක්ෂමතාවයේ අවශ් යතාවය සමතුලිත කිරීම
**තේරීම් නිර්දේශ **:
- නිරවද් යතාවයට ප් රමුඛතාවය දෙන්න: PSENet වැනි සංකීර්ණ ඇල්ගොරිතම තෝරන්න
- වේගයට ප් රමුඛතාවය දෙන්න: DBNet වැනි සැහැල්ලු ඇල්ගොරිතම තෝරන්න
- බහුකාර්යතාව: කාර්ය සාධනය සමතුලිත කරන ඊස්ට් වැනි ඇල්ගොරිතම තෝරන්න
තාක් ෂණයේ අඛණ්ඩ සංවර්ධනයත් සමඟ, පෙළ හඳුනාගැනීමේ ඇල්ගොරිතම ඉහළ නිරවද් යතාවය, වේගවත් වේගය සහ ශක්තිමත් සාමාන් යකරණ හැකියාවන් දිශාවට අඛණ්ඩව වර්ධනය වනු ඇත, OCR පද්ධති පුළුල් ලෙස යෙදීම සඳහා ශක්තිමත් තාක්ෂණික පදනමක් සපයයි.
ඇමිණුම්:
EAST
DBNet
PSENet
පෙළ හඳුනා ගැනීම
වස්තු හඳුනා ගැනීම
FPN
NMS
OCR