Tekstleri tanamak

26.04.2024

Word 2007 tekst redaktory ýazylan ýazgylary tanamak işini tanamagyň dili esasyndaýerine ýetirýär. Redaktorda ýazylan ýazgyny tanamagyň diliniň goldaýan sözlügibolmaly.

Elektron dokumentleriň kitaphanalaryny we arhiwlerini döretmek, olary kompýuteriň formatyna geçirmek işi üçin simwollary optiki tanamak ulgamy bilen ýerine ýetirilýär. Elektron dokument dolanyşygyny döretmegi çaltlandyrmak üçin adaty kagyz dokumentleri kompýuteriň skanergurluşy arkaly, olaryň şekli kompýuteriň ýadyna girizilýär, ondan soň olar optiki tanamak usuly bilen Word tekst redaktorynyň dokumentlerine öwrülýär.

Skanirlenip kompýuteriň ýadyna geçirilen sahypadaky tekstiň şekli grafik faýlda –surat görnüşde bolýar. Grafik şekilleri tekste öwürmegi tekstleri tanaýan ýörite programmalar OCR (Optical Character Recognition -OCR)ýerine ýetirýär. Şeýle programmalar suratda getirilen tekstiň şriftleriniň görnüşüni, möçberini hat-da golýazmadaky teksti tanamaly. Programmalar tekstde ýazylan tablisalary, hatda tekst birnäçe dilde ýazylan hem bolsa tanamaly. Programmalar skanirlenen dokumentiň tekstini tanamak bilen çäklenmän tanalan teksti tekst redatorynyň formatyna geçirmeli hem-de ýatda saklamagy başarmaly.

Skanirlenen dokumentiň teksti neşir görnüşli bolsa tanamak işi her bir simwoly rastr ülňi bilen deňeşdirmek arkalyýerine ýetirilýär. Ilki bilen sahypanyň rastr şekli aýratyn simwollaryň şekillendirilişine bölüşdirilýär. Ondan soň olaryň her biri sistemanyň ýadyndaky simwollaryň ülňüleri bilen yzygiderlikde gabatlaşdyrylýar, netijede deňeşdirmelerinde iň az tapawut bolan ülňi esas edip alynýar.

Skanirlenen tekstleri optiki tanamak işi köplenç FineReaderprogramma bilen ýerine ýetirilýär.

Soňky ýyllarda gol bilen ýazylan tekstlerdäki simwollary tanamak işi durmuşda köp duş gelýär. Bu iş jübi kompýuterleriniň ýörite galamy bilen ýazylan golýazmany, programma kompýuterdäki tekst dokumente öwürýär.

Tekstleri tanamagyň FineReaderprogrammasy işlendik şriftde ýazylan teksti tanaýar. Programma grafiki tekstlerdäki şriftleri ýokary takyklykda tanaýar. FineReader programmasy tanamak işinde goşmaça funksiýalar bermek bilen çäklenmän, dünýaniň 176 dilindäki ýazylan tekstleri tanamagy üpjün edýar. FineReaderprogrammasynyň ähli görnüşleriniň ulanyş interfeýsi ýönekeýdir. Onda tanamak prosesini işe girizmek üçin dokumenti skanere goýmaly hem-de programmanyň gurallar panelindäki ýekeje Scan & Read düwmäni basmaly. Tanamak işiniň dowamyny programmanyň özi awtomatiki ýerine ýetirýär.

Sahypany tanamak işini tamamlandan soňFineReaderprogramma ulanyjydan ýene skanirlemelimi hem-de tanamagy dowam etdirmelimi ýa-da alynan teksti Microsoft Office-de,HTML-deýa-da PDFformatda ýatda saklamalymy diýip sorar.

Kerwen AGANYÝAZOW
Türkmenistanyň Telekommunikasiýalar
we Informatika institutynyň talyby

Leave a Reply

Your email address will not be published.

loader-image
Ashgabat
6:28 pm, Sep 20, 2024
temperature icon 29°C
переменная облачность
Humidity 20 %
Pressure 1014 mb
Wind 18 mph
Wind Gust Wind Gust: 0 mph
Clouds Clouds: 40%
Visibility Visibility: 0 km
Sunrise Sunrise: 6:52 am
Sunset Sunset: 7:07 pm
Öňki taryh

Algoritm meseläni çözmegiň umumy usulýetidir

Next Story

Skaneriň görnüşleri

Soňkylar Makalalar

ISGENDERGALA

20.09.2024
Rowaýatçylaryň aýtmagyna görä, bu galanyň adynyň «Isgendergala»bolmagynyň sebäbi şeýledir: Gadym wagtlarda Balkan daglarynyň düýbüni etekläp oturan obanyň ortasynda uly gala bolupdyr. Ol galanyň adamlary

Garaşsyzlyk – ýurdumyzyň sarsmaz geljegidir!

20.09.2024
Berkarar döwletiň täze eýýamynyň Galkynyşy döwri ajaýyp zamana. Şu ajaýyp zamanamyzyň her bir güni bagtyýarlyga beslenýär. Bagtyýar ilimiziň senenamamyzyň ajaýyp, naýbaşy baýramy bolan mukaddes

Grammatik derňew nusgalary

20.09.2024
Türkmen dilini grammatika taýdan derňemegiň esasy üç görnüşi mälimdir: fonetik derňew, morfologik derňew, sintaktik derňew. Fonetik derňew sözleriň ses düzümini derňemekdir. Munda sözi emele
GitTop