Skip to main content

ලිනක්ස් ඉගෙන ගමු (Linux) - 28

Scanner සැකසීම

කොලයක තිබෙන දෙයක් පරිගණකය තුළට ගැනීමට ඇති හොඳම ක්‍රමය මෙය වේ. ස්කැනර් එකක් නැති අවස්ථාවක ෆෝන් එකේ කැමරාවෙන් හෝ වෙනත් කැමරාවකින් එම කොලයේ ෆොටෝ එකක් ගෙන එය පරිගණය තුළට ගැනීමට හැකියි. එවිට හොඳම කොලිටියෙන් ෆොටෝ එක ගැනීම වැදගත්. අද පවතින ස්කැනර් usb පෝට් එකකින් පරිගණකයට සම්බන්ධ කෙරේ. ඔබ කොමියුනිකේෂන්වල නිතර දකින ෆොටෝකොපි යන්ත්‍රයද ස්කැනරයක් හා ප්‍රින්ටරයක් යන දෙකම එකට පවතින උපකරණයකි. එහිදී ඔබ දැක ඇති එම යන්ත්‍රයේ පියනක් ඔසවා කොපි කළ යුතු කොලය තබයි. එවිට එම කොලය ස්කෑන් වී එහි ඇති ලේසර් ප්‍රින්ටරයෙන් ප්‍රින්ට් වේ. පරිගණකයකට ස්කැනර් එකක් ගැනීමේදී අර ෆොටෝකොපි මැෂින් එකේදී මෙන් පියන ඇර කොලය තැන්පත් කළ හැකි ආකාරයේ එකක් ගැනීමට වගබලා ගන්න (flatbed scanner). ඔබ දැක තිබෙනවා ෆැක්ස් මැෂින්. එහිත් ඇත්තටම ස්කැනර් එකක් හා ප්‍රින්ටරයක් ඇත. එහෙත් මෙහිදී ෆැක්ස් කළ යුතු කොලය ඇතුලු කරන්නේ සිහින් ට්‍රේ එකක් තුළටය. එවිට එම කොලය එම ට්‍රේ එකේ කැරකෙන රෝලර් අතරින් ගමන් කරයි. මේ ආකාරයට සාදා තිබෙන ස්කැනර්ද ඇත. එහෙත් එවැන්නකට වඩා ඉහත ෆ්ලැට්බෙඩ් ස්කැනර් එකක් ගැනීම උචිතයි. ෆ්ලැට්බෙඩ් වර්ගයේ එකකින් ඕනෑම ගණකමක් සහිත දෙයක් ස්කෑන් කර ගන්නට හැකියි (පාස්පෝට් වැනි දේවල් පවා; කැමති නම් ඔබේ අතේ අත්ල පවා). එහෙත් අර ට්‍රේ එකකින් කොලය යන ජාතියේ ඒවායේ තුනී (සාමාන්‍ය) කොල පමණයි ස්කෑන් කළ හැක්කේ.


බොහෝ ස්කැනර් (ප්‍රින්ටර්වල මෙන්ම) ඉබේම ලිනක්ස්වලින් ඩිටෙක්ට් කරනවා (ඒ කියන්නේ ලිනක්ස්වල වැඩ කරනවා). ස්කැනර් එක පරිගණකයට කනෙක්ට් කරන්න. සමහර ස්කැනර්වලට පිටින් විදුලිය ලබා දිය යුතු අතර, තවත් ඒවාට එලෙස පිටතින් විදුලිය අවශ්‍ය නැත; පරිගණකයේ usb පෝට් එකෙන්ම ඊට අවශ්‍ය විදුලිය ලබා ගනී. ඉන්පසු සුදුසු ස්කෑන් සොෆ්ට්වෙයාර් එකකින් ස්කෑන් කටයුත්ත කළ හැකියි. ඒ සඳහා ඉතා සරල හා පහසු Simple Scan යන ප්‍රෝග්‍රෑම් එක ඉන්ස්ටෝල් කරගත හැකියි (පහත රූපය).


ස්කෑන් කිරීමට අවශ්‍ය කොලය ස්කැනර් එක මත නිවැරදිව තබන්න. ඉන්පසු Scan කියන ටූල් බට්න් එක මත ක්ලික් කරන්න. දැන් එය ස්කෑන් වේවි (එය ස්කෑන් වෙන ගමන් තිරය මතද කුඩාවට එය පෙන්වාවි). ඉන්පසු එය ෆයිල් එකක් ලෙස සේව් කළ හැකියි Save යන බට්න් එක ක්ලික් කර. PDF හා තවත් ඉමේජ් ෆෝමැට් කිහිපයකින්ම ස්කෑන් ඉමේජ් එක සේව් කරගත හැකියි. තවත් ස්කෑන් එකක් කිරීමට වම් කෙළවරම ඇති ටූල් එක ක්ලික් කර පෙර සේම අලුත් කොලය ස්කැනර් එකට දමා Scan ටූල් එක ඔබා ඉනපසු Save ටූල් එකෙන් සේව් කරගත හැකියි. ස්කෑන් වෙච්ච කොලය වමට හෝ දකුණට කරකැවීමටද (rotate) ටූල් බට්න් දෙකක් ඇත. සමහර අවස්ථාවල ස්කෑන් කරපු සම්පූර්ණ කොලයම වෙනුවට ඉන් කොටසක් පමණක් ඔබට සේව් කිරීමට අවශ්‍ය විය හැකියි. එවිට Crop ටූල් එක ඉහත රූපයේ ටූල්බාර් එකේ දකුණු කෙළවරම ඇත. අවශ්‍ය නම්, ස්කෑන් කරපු එකක් කෙලින්ම ප්‍රින්ට් කර ගන්නට හැකියි Document → Print මඟින්.

සාමාන්‍යයෙන් ස්කෑන් කරන විට අකුරු බහුල කොලයක් ස්කෑන් කරනවාට (text mode) වඩා රූප බහුල කොල ස්කෑන් කිරීම (image/photo mode) තරමක් වෙනස්ය. රූපයේ කොලිටියට හානි නොවීමට ඉතා හොඳින් (වැඩි කාලයක් ගෙන) එය ස්කෑන් කිරීම සුදුසුය. රූපයක්ද නැතිනම් අකුරුද ස්කෑන් කරන්නේ කියා ඔබට ස්කැනර් එකට පැවසීමට සිදු වේ. ඒ සඳහා ඉහත රූපයේ Scan බට්න් එකට පසුව පෙනෙන කුඩා ඊහිස මත ක්ලික් කරන්න. එවිට මෙනු එකක් මතු වේවි. එහි Text, Photo යනුවෙන් අයිටම් දෙකක් පෙනේවි. ඉන් කැමති එක තෝරන්න. ඔබ ස්කෑන් කරන තනි තනි කොලය තනි තනිවයි ඉහත සේව් කළේ. ඔබට අවශ්‍ය නම්, ස්කෑන් කරන සියලු කොල තනි එක ෆයිල් එකක් ලෙස සේව් කළ හැකියි නිකංම Scan බට්න් එක ක්ලික් නොකර ඉහත ඊහිස මත ක්ලික් කර ඉන් Single Page යන්න තේරුවොත්. ස්කෑන් කරන සෑම කොලයක් පාසාම මෙලෙස සිදු කරන්න.

ස්කැනර් එකේ යම් යම් සෙටිංස් සැකසියද හැකියි. ඒ සඳහා Document → Preferences යන්න. එවිට පහත රූපය ලැබේවි. මෙහි උඩින්ම Scan Source යන්නෙන් පෙන්වන්නේ ස්කැනර් එකයි. Text Resolution යනු ටෙක්ස්ට් මෝඩ් එකෙන් ස්කෑන් කරන විට, එය ස්කෑන වන කොලිටිය මෙයින් සැකසේ. මෙහි dpi (dots per inch) යනු කොලයේ වර්ග අඟලක ප්‍රමාණයක් ගත් විට එහි ස්ථාන (පොයින්ට්ස්) කීයක්ද (කීයක් ස්කෑන් කළ යුතුද) යන්නයි. මෙහි අගය වැඩිවන තරමට කොලිටිය වැඩි වේ. ස්කෑන් වීමට ගතවන කාලයද වැඩි වේ. සේව් කරන විට ෆයිල් සයිස් එකද වැඩි වේ. Photo Resolution යන්නෙහි සෙට් කරන්නේ ෆොටෝ මෝඩ් එකෙන් ස්කෑන් කරන විට, කොච්චර කොලිටියක් තිබිය යුතුද යන්නයි. පෙරත් මා සඳහන් කළා සාමාන්‍යයෙන් එහි කොලිටිය ටෙක්ස්ට් මෝඩ් එකට වඩා වැඩි බව. Brightness, Contrast, Quality යනුද ඔබ දන්නා සෙටිං තුනක් ස්කෑන් වන රූපයේ ආලෝක මට්ටම (සුදු ගතිය), කලු-සුදු දෙක අතර කැපී පෙනීම, හා කොලිටිය සෙට් කිරීමට යොදා ගන්නා.


OCR

ස්කෑන් කරපු ලියකියවිලිවල අකුරු හා රූප ලෙස පෙනෙන සියලු දේවල් පරිගණකය තුළ සේව් වන්නේ රූප වශයෙනි. එමනිසා එම අකුරු සාමාන්‍ය ටෙක්ස්ට් ෆයිල් එකක කරන්නාක් සේ එහි ඇති අකුරු වෙනස් කළ නොහැකියි. ඔබට එවැනි ඉමේජ් ෆෝමැට් එකෙන් තිබෙන ලියවිලි සාමාන්‍ය ටෙක්ස්ට් බවට පත් කිරීමට අවශ්‍ය නම්, ඊට ඇති එකම පහසු ක්‍රමය නම් OCR (Optical Character Recognition) ලෙස හැඳින්වේ. මෙහිදී පළමුවෙන්ම ස්කෑන් කරපු ෆයිල් එකක් (pdf, gif, jpeg, tiff වැනි) ඉමේජ් ෆෝමැට් එකකින් තිබීම අත්‍යවශ්‍ය වේ. තවද, එම ඉමේජ් එකේ තිබෙන අකුරු පැහැදිලිව කියවිය හැකි මට්ටමේ තිබිය යුතුය. ඔබට වුවත් බැහැ නේද අකුරු පැහැදිලි නැති අකුරු කියවන්න. ඉතිං පරිගණකය ගැන කවර කතාද?

ඕසීආර් කිරීමට වෙනමම ප්‍රෝග්‍රෑම් ඇත. සාමාන්‍යයෙන් මෙම ඕසීආර් ක්‍රියාවලිය සිදු කරන කොටසට OCR engine ලෙස සඳහන් කෙරෙනවා. වැදගත්ම එමෙන්ම ඇත්තටම ඉමේජ් ටෙක්ස්ට් බවට පත් කරන කොටස එයයි. Tesseract යන නමින් එවැනි ඉතා හොඳ ෆ්‍රී ඕසීආර් එන්ජින් එකක් තිබෙනවා. සිනැප්ටික් එකෙන් එය (Tesseract-OCR) ඉන්ස්ටෝල් කරගත හැකියි. එන්ජින් එකට අමතරව ඒ ඒ භාෂාව වෙනුවෙන්ද කොටස් ඉන්ස්ටෝල් කිරීමට සිදු වේ. උදාහරණයක් ලෙස, ඔබ ඕසීආර් කරන්නේ ඉංග්‍රිසි අක්ෂර නම්, ඉංග්‍රිසි අක්ෂරවලට අදාල කොටසද ඉන්ස්ටෝල් කර ගන්න. ඒ ලෙසට ප්‍රංශ, ජර්මන්, ස්වාහිලි වැනි ලෝකයේ ප්‍රසිද්ධ භාෂාවන්/අක්ෂර සඳහා ටෙසරැක්ට් එන්ජින් එක සමග වැඩකරන භාෂා කොටස්ද සාදා තිබෙනවා. සිනැප්ටික් එකෙන්ම tesseract කියා ටයිප් කළ විට, එම භාෂාවන්ට අදාල ටෙසරැක්ට් කොටස්/ප්‍රෝග්‍රෑම් පෙන්වාවි. ඉන් තමන් කැමැති භාෂාව/භාෂාවන්ද ඉන්ස්ටෝල් කර ගන්න.


ඉන්පසු ග්‍රැෆිකල් ආකාරයට මෙම ටෙසරැක්ට් සමග වැඩ කිරීමට තවත් ප්‍රෝග්‍රැම් එකක් අවශ්‍ය වේ. ඒ සඳහා OCR Feeder නම් භාවිතා කළ හැකියි (පහත රූපය). jpeg, jif වැනි රූපයක් (දැනටමත් ස්කෑන් කර තිබෙන) ප්‍රෝග්‍රැම් එකට එකතු කර ගත හැකියි File → Add Image යන්න මඟින්. එලෙසම pdf (ඉමේජ්) ෆයිල් එකක් ප්‍රෝග්‍රැම් එකට එකතු කර ගත හැකියි File → Import PDF මඟින්. ඒවිතරක්ද නොවේ, කෙලින්ම ස්කැනර් එකෙන් ෆයිල් එකක් මීට එකතු කර ගත හැකියි File → Import Page from Scanner යන්නෙන්.



ඉහත ආකාරයට අවශ්‍ය ෆයිල් ප්‍රෝග්‍රැම් එකට එකතු කරගත් පසු, දැන් එය ඕසීආර් කළ යුතුය. ප්‍රෝග්‍රැම් එකේ වම් පැත්තේ පෙන්වනවා එක ඉමේජ් එකක් හෝ කිහිපයක්. ඉන් තමන් කැමති එක් ඉමේජ් එකක් තෝරා Document → Recognize Page යන්න තේරීමෙන් එම ඉමේජ් ෆයිල් එක ඕසීආර් කළ හැකියි. අවශ්‍ය නම් එකතු කර තිබෙන සියලුම ෆයිල් ඕසීආර් කළ හැකියි Document → Recognize Document යන්න තේරීමෙන්. එවිට ඉහත වින්ඩෝ එකේම දකුණු පසින් පෙන්වාවි ඩොක්‍යුමන්ට් එකේ ටෙක්ස්ට් (අක්ෂර). සමහර අවස්ථාවල ඉතා නිවැරදිවම අක්ෂර හඳුනාගෙන නොතිබේවි. එවිට එවැනි තැන් අතින් (මැනුවලි) නිවැරදි කළ හැකියි. ඉන්පසු එම ටෙක්ස්ට් කොපි කර ගත හැකියි. නැතිනම් File → Export මඟින් odt, html වැනි ෆෝමැට් එකකින් සේව් කර ගතද හැකියි.

Comments

Popular posts from this blog

කතාවක් කර පොරක් වන්න...

කෙනෙකුගේ ජීවිතය තුල අඩුම වශයෙන් එක් වතාවක් හෝ කතාවක් පිරිසක් ඉදිරියේ කර තිබෙනවාට කිසිදු සැකයක් නැත. පාසැලේදී බලෙන් හෝ යම් සංගම් සැසියක හෝ රැස්වීමක හෝ එම කතාව සමහරවිට සිදු කර ඇති. පාසලේදී කතා මඟ හැරීමට ටොයිලට් එකේ සැඟවුනු අවස්ථාද මට දැන් සිහිපත් වේ. එහෙත් එදා එසේ කතා මඟ හැරීම ගැන අපරාදේ එහෙම කළේ යැයි අද සිතේ. යහලුවන් ඉදිරියේ "පොර" වෙන්න තිබූ අවස්ථා මඟ හැරුණේ යැයි දුකක් සිතට නැඟේ. ඇත්තටම කතාවක් කිරීම "පොර" කමකි. දක්ෂ කතිකයන්ට සමාජයේ ඉහල වටිනාකමක් හිමි වේ. පාසැලේදී වේවා, මඟුලක් අවමඟුලක් හෝ වෙනත් ඕනෑම සමාජ අවස්ථාවකදී වේවා දේශපාලන වේදිකාව මත වේවා කතාවක් කිරීමේදී පිලිපැදිය යුත්තේ සරල පිලිවෙතකි. එහෙත් එම සරල පිලිවෙත තුල වුවද, තමන්ගේ අනන්‍යතාව රඳවන කතාවක් කිරීමට කාටත් හැකිය. පුද්ගලයාගෙන් පුද්ගලයා වෙනස් වේ. එම වෙනස ප්‍රසිද්ධ කතා (public speaking) තුලද පවත්වාගත හැකිය. මේ ගැන මට ලිපියක් ලියන්නට සිතුනේ මාගේ මිතුරෙකුට ප්‍රසිද්ධ කතාවක් කිරීමට අවශ්‍ය වී, ඒ ගැන මේ ළඟ දවසක අප පැයක් පමණ සිදු කළ සංවාදයක් නිසාය. මා ප්‍රසිද්ධ දේශකයකු නොවුණත් මේ විෂය සම්බන්දයෙන් පාසැල් කාලයේ සිටම පත ...

ලංකාවේ දේශපාලන පවුල්

තරමක ඕපාදූපයක් ගැන ලියන්නට හිතුනා. මේක දේශපාලන ඔපාදූපයක්. ලංකා දේශපාලනය හැඩගැස්වීමට (හොඳට නරකට) මූලික වූ දේශපාලන චරිත හා පරම්පරා කිහිපයක තොරතුරු ටිකක් ගැනයි මේ සටහන. ඔවුන් එකිනෙකා නෑයෝ. අන්න ඒ නෑදෑකම් ගැන පමනයි මා මෙහිදි සටහන් කරන්නට සිතන්නේ. සේනානායක, බණ්ඩාරනායක, ඔබේසේකර, විජේවර්ධන, ජයවර්ධන, කොතලාවල ආදී පරම්පරා අතර තිබෙන නෑ සබඳතා ගැනයි මේ විමසුම. එහෙත් ඒ ගැන ලිවීමට පෙර මේ මොහොතේ සමාජ මාධ්‍ය තුල පක්ෂ විපක්ෂව කතා කෙරෙන ජනපති අනුර හා පිරිසගේ විදෙස් සංචාර වියදම හා ඊට සාපේක්ෂව හිටපු ජනපතිවරුන්ගේ විදෙස් සංචාරක වියදම ගැනත් කෙටියෙන් සටහනක් තැබීමට කැමතියි. හිටපු ජනපතිවරුන්ගේ, විශේෂයෙන් මහින්ද රාජපක්කගේ විදෙස් සංචාර ගැන අපට ඇත්තටම ඇත්තේ පිලිකුලකි. උන් රටේ දුප්පත් ජනයාගේ වියදමින් එම ගමන් බිමන් ගියේ හා විනෝද වුනේ ධනවත් කුවේරයන් මෙනි. ඒ ගැන තිබෙන පිලිකුල එලෙසම නොවෙනස්ව තිබේ. ඊට සාපේක්ෂව අනුර කුමාරගේ වියදම රුපියල් ලක්ෂ 18ක් බව පැවසේ. මේ ගැන චාමර මන්ත්‍රී වරයා පාර්ලිමේන්තුවේදී අපූරු කතාවක් කලා. අනුරට බාගේ ටිකට් කඩලද දන්නේ නැහැ යනුවෙන් ඔහු කල හාස්‍යජනක ප්‍රකාශය ඇත්තටම ඇසිය යුතු ඉතාම නිවැරදි ප්‍රකාශයය...

අව් කන්නාඩියක් (sunglass) තෝර ගන්නා හැටි

මෑතකදී මා මිල දී ගත් අව් කන්නාඩියේ ප්‍රමිතිය ගැන මට ගැටලුවක් ඇති විය. දැන් මා එම ගැටලුව මුලු මනින්ම විසඳා ගත් අතර, එහි ඇති වැදගත්කම නිසා ඒ ගැන කෙටි ලිපියක් ලියන්නට සිතුනා. සමහර අය සිතන්නේ අව් කන්නාඩි පලදින්නේ සෝබනේට බවයි. ඔව්, සෝබනේටත් එය පැලදිය හැකි අතර මා සිතන්නේ ලංකාවේ බොහෝ අය එය පලදින්නේ ඇත්තටම සෝබනේට තමයි මොකද ඔවුන් මිල දී ගන්නා අව් කන්නාඩියේ තිබිය යුතු වැදගත් අංග මොනවාද යන්න ගැන අවබෝධයක් නැති අතර, හුදෙක්ම එහි හැඩය ගැන පමනයි සලකන්නේ. පලමුව කිව යුත්තේ ප්‍රමිතිගත අව්කන්නාඩි පැලදීම ඇත්තටම ඉතාම හොඳ සෞඛ්‍යසම්පන්න පුරුද්දක් බව. ඊට හේතු කිහිපයක් තිබේ. එලිමහනේ යද්දී හෝ සිටිද්දී අපේ ඇසට සාමාන්‍ය ආලෝකයට පමනක් නොව පාරජම්බූල කිරන (ultraviolet rays - UV rays) පවා ඇතුලු වේ. පාරජම්බූල කිරන යනු ඇසට පමනක් නොව, බොහෝ දේවලට අහිතකර කිරණ විශේෂයකි (හරියට එක්ස්රේ වගේ දරුනුයි යැයි සිතන්න). ඉතිං, එක්ස් කිරණ මෙන්ම පාරජම්බූල කිරණද අපේ ඇසට කොතරම් ඇතුලු වුවත් අපට එය තේරෙන්නේ නැත (ඇස සංවේදී නැත). ඉතිං, පාරජම්බූල කිරණ ඇසට ඇතුලු වූ විට ඇසේ සුද මතු වේ. අද එය සුලභ රෝගයකි (බොහෝ අය කාච දමන්නේ එම රෝගය නිසාය).  ඉති...