UyApp
首页
注册

ھەقسىز!يەرلىكتە ئۇيغۇرچە رەسىمدىن خەت تونۇش ئىقتىدارىنى ئەمەلگە ئاشۇرۇش

UyApp
مۇمكىن ئەمەس ئىش ،مەۋجۇت ئەمەس ئىش
2024-03-03 15:53:05

ياخشىمۇسىلەر كۆپچىلىك ،يىقىندا تۇيۇقسىز ئۇيغۇچە رەسىمدىن خەتنى تونۇش ئىقتىدارنى ياساش ھەمدە پۈتۈنلەي ھەقسىز قىلىپ ئىچىۋىتىشنى ئويلاپ قالدىم .رەسىمدىن خەتنى تونۇش ئىقتىدارى (OCR) ئىقتىدارى بەك ئىلغار تېخنىكىمۇ ئەمەس ، بادام،بارماق قاتارلىق تونۇشلۇق بولغان ئۇيغۇرچە كىرگۈزگۈچلەردىمۇ ئۇيغۇرچە رەسىمدىن خەت تونۇش ئىقتىدارى بار ، لىكىن بۇ ئىقتىدارنىڭ API سىنى سىرتقا ھەقسىز تەمىنلىمىگەن .

گەپكە كەلسەك يىقىندا تور ئارلاۋىتىپ بىر EasyOCR نامىدىكى ئىچىۋىتىلگەن (OCR) رامكىنى بايقاپ قالدىم,ھەمدە مۇۋاپىقىيەتلىك ئۇيغۇرچە خەتنى تونۇتۇپ چىقتىم ،ئەڭ ياخشى يەرى بۇ تۈردە تور كەتمەيدىغان بولۇپ يەرلىكتىلا رەسىملەرنى تونۇتشنى ئىشقا ئاشۇرغىلى بولىدۇ،شۇڭا سىلەر بىلەن بۇ تېما توغۇرلۇق بىلگەنلىرىمنى ھەمبەھىرلىمەكچى.

OCR تېخنىكىسى ھەققىدە:

OCR نىڭ ئاساسى ئوپتىكىلىق ھەرپ پەرقلەندۈرۈش تېخنىكىسى بولۇپ، ئۇ بۈگۈنكى رەقەملىك دۇنياغا نىسبەتەن ئىنقىلاب خاراكتېرلىك ئەھمىيەتكە ئىگە. OCR ئەمەلىيەتتە بىر مۇكەممەل جەريان، رەقەملىك دۇنيادا مەۋجۇت بولغان سۈرەت/ئارخىپلارنى ئادەتتىكى تەھرىرلىگىلى بولىدىغان تېكىستكە ئايلاندۇرىدۇ

EasyOCR دىگەن نىمە:

EasyOCR ئەمەلىيەتتە Python بولىقى بولۇپ،داڭلىق بولغان چوڭقۇرلاپ ئۈگۈنۈش تۈرى PyTorch نى ئاساس قىلىپ ئىشلىتىدۇ.ھەمدە NVIDIA كۆرسىتىش تاختىسىنىڭ CUDA تۈرى ئارقىلىق تونۇش سۈرئىتىنى ھەسسىلەپ ئاشۇرىدۇ.ئەگەر GPU رىڭىزنىڭ ئىقتىدارى تۆۋەن بولسا CPU ئارقىلىقمۇ تونۇتقىلىق بولىدۇ،لىكىن سۈرئىتى ئاستىلاپ كىتىدۇ .

EasyOCR باشقا OCR (Google tesseract ياكى باشقا) غا ئوخشاش رەسىمدىكى تېكىستنى بايقىيالايدۇ، ئەمما ئۇنى ئىشلەتكەندە، ئۇنى رەسىمدىكى تېكىستنى بىۋاستە تونۇيدىغان بولۇپ، PyTorch ئارقىلىق ئۆزلىكىدىن ئۈگۈنۈشنى ئەمەلگە ئاشۇرىدۇ.بۇنداق بولغاندا تېخىمۇ ئىشەنچلىك نىسبىتى تېخىمۇ ئاشىدۇ.

ئىشلىتىش ئۇسسۇلى:

  1. ئىشلەتكەن مۇھىت:
  • كومپىيۇتىر سېستىمىسى : Windows10 تاختا كومپىيۇتىر
  • مەركىزى بىرتەرەپ قىلغۇچ(CPU) : 11th Gen Intel(R) Core(TM) i5-11400H
  • سۈرئەت بىرتەرەپ قىلغۇچ(GPU/显卡) : NVIDIA GeForce RTX 3050 Laptop GPU
  • ئىچكى ساقلىغۇچ (RAM) : 16G
  • Python : ئورگان نەشىرى3.10

2.كومپىيۇتىردا مۇھىت ھازىرلاش:

  • Pytorch نى چۈشۈرۈش :

*****چۈشۈرۈشتىن بۇرۇن كومپىيۇتىرغا python مۇھىتىنى ھازىرلاپ بولغان بولىشىغا كاپالەتلىك قىلىڭ،بۇ دەرىسلىكتە Python مۇھىتىنى ھازىرلاشنى سۆزلىمەيمىز.

Pytorch ئورگان تورنىدىن چۈشۈرۈش

https://pytorch.org/

ئاندىن ئەگەر CUDA نى چۈشۈرمىگەن بولسىڭىز ياكى كومپىيۇتىردا NVIDIA سۈرەت كۆرسەتكۈچ بولمىسا مەن تاللىغان مۇشۇ يول بويىچە تاللاڭ

72cdfc3c15e96ef1d08ca02a31cdc39e_release.png

ئاندىن ئاستىدىكى بىر قۇر خەتنى كۆچۈرۋىلىپ CMD كۆزنىكگە چاپلايمىز

ff3ffe83568b77080936b89144298f1f_release.png

بۇ چۈشۈپ بولغاندىن كىيىن مۇشۇ كۆزنەكتە ئاستىدىكى بۇيرۇقنى يۈرگۈزىمىز

pip install easyocr   

3. تۈر قۇرۇش :

بەزى بولاقلارنى چۈشۈرۈش ئۈچۈن چەتئەلنىڭ تورىغا چىقىپ چۈشۈرۈش كىرەك ئىدى لىكن كۆپچىلىكنىڭ ئەھۋالىنى ئويلىشىپ ئۆزەم ئىشلەتكەن تۈرنى چىقىرىپ قويدۇم ، بىۋاستە ئىشلەتكىلى بولىدۇ

https://www.123pan.com/s/1yYZVv-M0jHA.html
提取码:uapp

مۇشۇنى چۈشۈرۈپ يېشىمىز,مۇندەرىجىسى مۇنداق چىقىدۇ:

3d62a764c7f9e72a552de6e0f21d9709_release.png

model -خەت تونۇشتا ئىشلىتىدىغان بولاق ئىچىدىكى نەرسىلەرنى يۇيۇشقا بولمايدۇ

demo.py - خەت تونۇشتا ئىشلىتىدىغان كود ،مۇشۇنىڭغا قاراپ ئۆزەڭلار بىر باشقىدىن يىزىۋالساڭلار بولىدۇ

UgOCR.php - مۇلازىمىتىردا ئىشلىتدىغان كود (مۇلازىمىتىردىمۇ ئوخشاش مۇھىت ھازىرلاش،ئارتۇق PHP مۇھىتى ھاىرلايسىز)

Uyghur.png - سىناق قىلىشتا ئىشلىتىدىغان رەسىم

4. قىسقىچە چۈشەندۈرۈش

تۈرنى يەشكەندىن كىيىن cmd ئارقىلىق مۇشۇ تۈرنىڭ مۇندەرىجىگە كىرىمىز،(ماۋۇ مىنىڭ تۈر مۇندەرىجەم)

77d59ae16eef86dd84a09a9bffc0ead2_release.png

ئاندىن سىناپ بىقىش ئۈچۈن مۇنۇ كودنى يۈرگۈزىمىز

python demo.py Uyghur.png
fbc680972886f63d2e57d0b68dcb2044_release.png
#python 代码
import argparse
import easyocr
import time,os
def main(image_path):
    start_time = time.time()
    reader = easyocr.Reader(['ug'], gpu=False, model_storage_directory='./model',download_enabled=False)
    results = reader.readtext(image_path)
    f=open("output.txt","w",encoding="utf-8")
    temp=""
    for result in results:
        temp+=result[1]
        temp+=" "
    end_time = time.time()
    temp+="\n用时: "+str(end_time - start_time)+"秒"
    f.write(temp.encode('utf-8').decode('utf-8'))        
    f.close()
    os.startfile("output.txt")

if __name__ == "__main__":
   
    parser = argparse.ArgumentParser(description='Process some images.')
    parser.add_argument('img', type=str, help='The path to the image file')
    args = parser.parse_args()
    main(args.img)


مەن كودنى مۇلازىمىتىرغا چىقىرىپ قويغان سىناققا ،

https://www.invisiblecode.cn/ugocr_demo/UgOCR.php

مۇشۇنىڭدا سىناق قىلىپ باقساڭلار بولىدۇ،لىكىن مۇلازىمتىر ئەرزان بولغاچقا سۈرئەت يامان ئاستا ،

POSTقىلىپ يوللايسىز، image مىقدارغا رەسىمنىڭ base64كودىنى

تۈرنى تەپسىلى سۆزلەپ بولدۇم . قالغان چۈشەنمىگە يەرلىرىڭلارنى ئىنكاس رايۇنىغا يىزىپ قويساڭلار بولىدۇ ، ياختۇرغان بولساڭلار مۇنبەرگە ئەزا بولۇپ تېمانى ھەمبەھىرلەپ قويۇڭلار، مۇنبىرىمز داۋاملىق ھەقسىز تېمىلارنى يوللاپ تۇرىدۇ