ياخشىمۇسىلەر كۆپچىلىك ،يىقىندا تۇيۇقسىز ئۇيغۇچە رەسىمدىن خەتنى تونۇش ئىقتىدارنى ياساش ھەمدە پۈتۈنلەي ھەقسىز قىلىپ ئىچىۋىتىشنى ئويلاپ قالدىم .رەسىمدىن خەتنى تونۇش ئىقتىدارى (OCR) ئىقتىدارى بەك ئىلغار تېخنىكىمۇ ئەمەس ، بادام،بارماق قاتارلىق تونۇشلۇق بولغان ئۇيغۇرچە كىرگۈزگۈچلەردىمۇ ئۇيغۇرچە رەسىمدىن خەت تونۇش ئىقتىدارى بار ، لىكىن بۇ ئىقتىدارنىڭ API سىنى سىرتقا ھەقسىز تەمىنلىمىگەن .
گەپكە كەلسەك يىقىندا تور ئارلاۋىتىپ بىر EasyOCR نامىدىكى ئىچىۋىتىلگەن (OCR) رامكىنى بايقاپ قالدىم,ھەمدە مۇۋاپىقىيەتلىك ئۇيغۇرچە خەتنى تونۇتۇپ چىقتىم ،ئەڭ ياخشى يەرى بۇ تۈردە تور كەتمەيدىغان بولۇپ يەرلىكتىلا رەسىملەرنى تونۇتشنى ئىشقا ئاشۇرغىلى بولىدۇ،شۇڭا سىلەر بىلەن بۇ تېما توغۇرلۇق بىلگەنلىرىمنى ھەمبەھىرلىمەكچى.
OCR نىڭ ئاساسى ئوپتىكىلىق ھەرپ پەرقلەندۈرۈش تېخنىكىسى بولۇپ، ئۇ بۈگۈنكى رەقەملىك دۇنياغا نىسبەتەن ئىنقىلاب خاراكتېرلىك ئەھمىيەتكە ئىگە. OCR ئەمەلىيەتتە بىر مۇكەممەل جەريان، رەقەملىك دۇنيادا مەۋجۇت بولغان سۈرەت/ئارخىپلارنى ئادەتتىكى تەھرىرلىگىلى بولىدىغان تېكىستكە ئايلاندۇرىدۇ
EasyOCR ئەمەلىيەتتە Python بولىقى بولۇپ،داڭلىق بولغان چوڭقۇرلاپ ئۈگۈنۈش تۈرى PyTorch نى ئاساس قىلىپ ئىشلىتىدۇ.ھەمدە NVIDIA كۆرسىتىش تاختىسىنىڭ CUDA تۈرى ئارقىلىق تونۇش سۈرئىتىنى ھەسسىلەپ ئاشۇرىدۇ.ئەگەر GPU رىڭىزنىڭ ئىقتىدارى تۆۋەن بولسا CPU ئارقىلىقمۇ تونۇتقىلىق بولىدۇ،لىكىن سۈرئىتى ئاستىلاپ كىتىدۇ .
EasyOCR باشقا OCR (Google tesseract ياكى باشقا) غا ئوخشاش رەسىمدىكى تېكىستنى بايقىيالايدۇ، ئەمما ئۇنى ئىشلەتكەندە، ئۇنى رەسىمدىكى تېكىستنى بىۋاستە تونۇيدىغان بولۇپ، PyTorch ئارقىلىق ئۆزلىكىدىن ئۈگۈنۈشنى ئەمەلگە ئاشۇرىدۇ.بۇنداق بولغاندا تېخىمۇ ئىشەنچلىك نىسبىتى تېخىمۇ ئاشىدۇ.
2.كومپىيۇتىردا مۇھىت ھازىرلاش:
*****چۈشۈرۈشتىن بۇرۇن كومپىيۇتىرغا python مۇھىتىنى ھازىرلاپ بولغان بولىشىغا كاپالەتلىك قىلىڭ،بۇ دەرىسلىكتە Python مۇھىتىنى ھازىرلاشنى سۆزلىمەيمىز.
Pytorch ئورگان تورنىدىن چۈشۈرۈش
https://pytorch.org/
ئاندىن ئەگەر CUDA نى چۈشۈرمىگەن بولسىڭىز ياكى كومپىيۇتىردا NVIDIA سۈرەت كۆرسەتكۈچ بولمىسا مەن تاللىغان مۇشۇ يول بويىچە تاللاڭ
ئاندىن ئاستىدىكى بىر قۇر خەتنى كۆچۈرۋىلىپ CMD كۆزنىكگە چاپلايمىز
بۇ چۈشۈپ بولغاندىن كىيىن مۇشۇ كۆزنەكتە ئاستىدىكى بۇيرۇقنى يۈرگۈزىمىز
pip install easyocr
3. تۈر قۇرۇش :
بەزى بولاقلارنى چۈشۈرۈش ئۈچۈن چەتئەلنىڭ تورىغا چىقىپ چۈشۈرۈش كىرەك ئىدى لىكن كۆپچىلىكنىڭ ئەھۋالىنى ئويلىشىپ ئۆزەم ئىشلەتكەن تۈرنى چىقىرىپ قويدۇم ، بىۋاستە ئىشلەتكىلى بولىدۇ
https://www.123pan.com/s/1yYZVv-M0jHA.html
提取码:uapp
مۇشۇنى چۈشۈرۈپ يېشىمىز,مۇندەرىجىسى مۇنداق چىقىدۇ:
model -خەت تونۇشتا ئىشلىتىدىغان بولاق ئىچىدىكى نەرسىلەرنى يۇيۇشقا بولمايدۇ
demo.py - خەت تونۇشتا ئىشلىتىدىغان كود ،مۇشۇنىڭغا قاراپ ئۆزەڭلار بىر باشقىدىن يىزىۋالساڭلار بولىدۇ
UgOCR.php - مۇلازىمىتىردا ئىشلىتدىغان كود (مۇلازىمىتىردىمۇ ئوخشاش مۇھىت ھازىرلاش،ئارتۇق PHP مۇھىتى ھاىرلايسىز)
Uyghur.png - سىناق قىلىشتا ئىشلىتىدىغان رەسىم
4. قىسقىچە چۈشەندۈرۈش
تۈرنى يەشكەندىن كىيىن cmd ئارقىلىق مۇشۇ تۈرنىڭ مۇندەرىجىگە كىرىمىز،(ماۋۇ مىنىڭ تۈر مۇندەرىجەم)
ئاندىن سىناپ بىقىش ئۈچۈن مۇنۇ كودنى يۈرگۈزىمىز
python demo.py Uyghur.png
#python 代码
import argparse
import easyocr
import time,os
def main(image_path):
start_time = time.time()
reader = easyocr.Reader(['ug'], gpu=False, model_storage_directory='./model',download_enabled=False)
results = reader.readtext(image_path)
f=open("output.txt","w",encoding="utf-8")
temp=""
for result in results:
temp+=result[1]
temp+=" "
end_time = time.time()
temp+="\n用时: "+str(end_time - start_time)+"秒"
f.write(temp.encode('utf-8').decode('utf-8'))
f.close()
os.startfile("output.txt")
if __name__ == "__main__":
parser = argparse.ArgumentParser(description='Process some images.')
parser.add_argument('img', type=str, help='The path to the image file')
args = parser.parse_args()
main(args.img)
تۈرنى تەپسىلى سۆزلەپ بولدۇم . قالغان چۈشەنمىگە يەرلىرىڭلارنى ئىنكاس رايۇنىغا يىزىپ قويساڭلار بولىدۇ ، ياختۇرغان بولساڭلار مۇنبەرگە ئەزا بولۇپ تېمانى ھەمبەھىرلەپ قويۇڭلار، مۇنبىرىمز داۋاملىق ھەقسىز تېمىلارنى يوللاپ تۇرىدۇ