Milliseid failivorminguid OCR-süsteem üleslaadimisel toetab?
OCR-süsteemid toetavad failide üleslaadimist mitmes vormingus, et kasutajad saaksid erinevatest allikatest pärit dokumente paindlikult redigeeritavaks tekstiks teisendada. Järgmised on mõned levinumad failivormingud, mida OCR-süsteemid võivad toetada.
Pildivorming:
JPEG/JPG: laialdaselt kasutatav pilditihendusvorming, mis sobib fotode ja skannitud dokumentide jaoks.
PNG: kadudeta tihendatud pildivorming, mis toetab läbipaistvust ja mida kasutatakse tavaliselt veebipiltide ja ikoonide jaoks.
TIFF/TIF (kaasa arvatud mitmeleheküljeline TIFF): kvaliteetne pildivorming, mida tavaliselt kasutatakse trüki- ja kirjastamistööstuses ning toetab mitmeleheküljelisi dokumente.
BMP: standardne pildivorming Windowsi süsteemides, mis on tihendamata ja millel on kõrge kvaliteet, kuid suured failisuurused.
GIF: pildivorming, mis toetab animatsiooni ja läbipaistvust. Kuigi seda kasutatakse peamiselt veebipiltide jaoks, võivad OCR-süsteemid seda ka toetada.
Dokumendi vorming:
PDF: kaasaskantav dokumendivorming, mida kasutatakse laialdaselt dokumentide, nagu e-raamatud, aruanded ja lepingud, jagamiseks ja printimiseks. OCR-süsteemid suudavad tavaliselt PDF-failides skannitud teksti ära tunda.
Kuigi OCR-süsteemid suudavad töödelda mitmes vormingus faile, võivad eri vormingus failid optilise tekstituvastuse protsessi käigus omada erinevat tuvastusefekti. Näiteks on kõrge skannimiskvaliteedi ja selgete piltidega TIFF-faile tavaliselt lihtsam täpselt ära tunda kui JPEG-faile. Seetõttu peaksid kasutajad failide üleslaadimise valimisel tegema valikuid oma vajaduste ja failikvaliteedi alusel.
JPEG/JPG: laialdaselt kasutatav pilditihendusvorming, mis sobib fotode ja skannitud dokumentide jaoks.
PNG: kadudeta tihendatud pildivorming, mis toetab läbipaistvust ja mida kasutatakse tavaliselt veebipiltide ja ikoonide jaoks.
TIFF/TIF (kaasa arvatud mitmeleheküljeline TIFF): kvaliteetne pildivorming, mida tavaliselt kasutatakse trüki- ja kirjastamistööstuses ning toetab mitmeleheküljelisi dokumente.
BMP: standardne pildivorming Windowsi süsteemides, mis on tihendamata ja millel on kõrge kvaliteet, kuid suured failisuurused.
GIF: pildivorming, mis toetab animatsiooni ja läbipaistvust. Kuigi seda kasutatakse peamiselt veebipiltide jaoks, võivad OCR-süsteemid seda ka toetada.
PDF: kaasaskantav dokumendivorming, mida kasutatakse laialdaselt dokumentide, nagu e-raamatud, aruanded ja lepingud, jagamiseks ja printimiseks. OCR-süsteemid suudavad tavaliselt PDF-failides skannitud teksti ära tunda.
Kuigi OCR-süsteemid suudavad töödelda mitmes vormingus faile, võivad eri vormingus failid optilise tekstituvastuse protsessi käigus omada erinevat tuvastusefekti. Näiteks on kõrge skannimiskvaliteedi ja selgete piltidega TIFF-faile tavaliselt lihtsam täpselt ära tunda kui JPEG-faile. Seetõttu peaksid kasutajad failide üleslaadimise valimisel tegema valikuid oma vajaduste ja failikvaliteedi alusel.