ಆಪ್ಟಿಕಲ್ ಕ್ಯಾರೆಕ್ಟರ್ ರೆಕಗ್ನಿಷನ್ (OCR) ಎನ್ನುವುದು ಮುದ್ರಿತ, ಟೈಪ್ ಮಾಡಿದ ಅಥವಾ ಕೈಬರಹದ ಡಾಕ್ಯುಮೆಂಟ್ನ ಡಿಜಿಟಲ್ ಆವೃತ್ತಿಯನ್ನು ರಚಿಸುವ ಸಾಫ್ಟ್ವೇರ್ ಅನ್ನು ಸೂಚಿಸುತ್ತದೆ, ಅದು ಕಂಪ್ಯೂಟರ್ಗಳು ಹಸ್ತಚಾಲಿತವಾಗಿ ಟೈಪ್ ಮಾಡದೆಯೇ ಅಥವಾ ಪಠ್ಯವನ್ನು ನಮೂದಿಸದೆಯೇ ಓದಬಹುದು. OCR ಅನ್ನು ಸಾಮಾನ್ಯವಾಗಿ ಪಿಡಿಎಫ್ ರೂಪದಲ್ಲಿ ಸ್ಕ್ಯಾನ್ ಮಾಡಿದ ದಾಖಲೆಗಳಲ್ಲಿ ಬಳಸಲಾಗುತ್ತದೆ, ಆದರೆ ಇಮೇಜ್ ಫೈಲ್ನಲ್ಲಿ ಕಂಪ್ಯೂಟರ್-ಓದಬಲ್ಲ ಪಠ್ಯದ ಪಠ್ಯವನ್ನು ಸಹ ರಚಿಸಬಹುದು.
ಓಸಿಆರ್ ಎಂದರೇನು?
ಪಠ್ಯ ಗುರುತಿಸುವಿಕೆ ಎಂದೂ ಸಹ ಕರೆಯಲ್ಪಡುವ OCR, ಮುದ್ರಿತ ಅಥವಾ ಲಿಖಿತ ದಾಖಲೆಗಳಿಂದ ಸಂಖ್ಯೆಗಳು, ಅಕ್ಷರಗಳು ಮತ್ತು ವಿರಾಮ ಚಿಹ್ನೆಗಳು (ಸಹ ಗ್ಲಿಫ್ಗಳು ಎಂದು ಕರೆಯಲಾಗುವ) ಅಕ್ಷರಗಳನ್ನು ಪರಿವರ್ತಿಸುವ ಸಾಫ್ಟ್ವೇರ್ ತಂತ್ರಜ್ಞಾನವಾಗಿದ್ದು, ಎಲೆಕ್ಟ್ರಾನಿಕ್ ರೂಪದಲ್ಲಿ ಸುಲಭವಾಗಿ ಗುರುತಿಸಲ್ಪಡುತ್ತದೆ ಮತ್ತು ಕಂಪ್ಯೂಟರ್ಗಳು ಮತ್ತು ಇತರ ಸಾಫ್ಟ್ವೇರ್ ಕಾರ್ಯಕ್ರಮಗಳಿಂದ ಓದುತ್ತದೆ. ಒಂದು ಡಾಕ್ಯುಮೆಂಟ್ ಸ್ಕ್ಯಾನ್ ಮಾಡಲ್ಪಟ್ಟಿದೆ ಅಥವಾ ಡಿಜಿಟಲ್ ಕ್ಯಾಮೆರಾದೊಂದಿಗೆ ಛಾಯಾಚಿತ್ರ ಮಾಡಲ್ಪಟ್ಟಿದೆ ಮತ್ತು ಇತರರು ಓಸಿಆರ್ ಇಲ್ಲದೆ ಹಿಂದೆ ಸ್ಕ್ಯಾನ್ ಮಾಡಲಾದ ಅಥವಾ ಛಾಯಾಚಿತ್ರ ಮಾಡಲಾದ ಡಾಕ್ಯುಮೆಂಟ್ಗಳಿಗೆ ಈ ಪ್ರಕ್ರಿಯೆಯನ್ನು ಅನ್ವಯಿಸಬಹುದು ಎಂದು ಕೆಲವು ಓಸಿಆರ್ ಕಾರ್ಯಕ್ರಮಗಳು ಇದನ್ನು ಮಾಡುತ್ತವೆ. OCR ಬಳಕೆದಾರರಿಗೆ PDF ಡಾಕ್ಯುಮೆಂಟ್ಗಳು, ಸಂಪಾದನೆ ಪಠ್ಯ, ಮತ್ತು ಮರು-ಫಾರ್ಮ್ಯಾಟ್ ದಾಖಲೆಗಳನ್ನು ಹುಡುಕಲು ಅನುಮತಿಸುತ್ತದೆ.
ಒಸಿಆರ್ ಏನು ಬಳಸಲಾಗುತ್ತದೆ?
ತ್ವರಿತವಾಗಿ, ಪ್ರತಿ ದಿನದ ಸ್ಕ್ಯಾನಿಂಗ್ ಅಗತ್ಯತೆಗಳು, OCR ಯು ದೊಡ್ಡ ವ್ಯವಹಾರವಾಗಿರಬಾರದು. ನೀವು ಹೆಚ್ಚಿನ ಪ್ರಮಾಣದ ಸ್ಕ್ಯಾನಿಂಗ್ ಮಾಡಿದರೆ, ನಿಮಗೆ ಅಗತ್ಯವಿರುವ ನಿಖರವಾದದನ್ನು ಕಂಡುಹಿಡಿಯಲು ಪಿಡಿಎಫ್ಗಳಲ್ಲಿ ಹುಡುಕಲು ಸಾಧ್ಯವಾಗುವಷ್ಟು ಸಮಯವನ್ನು ಉಳಿಸಬಹುದು ಮತ್ತು ನಿಮ್ಮ ಸ್ಕ್ಯಾನರ್ ಪ್ರೋಗ್ರಾಂನಲ್ಲಿ ಒಸಿಆರ್ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಹೆಚ್ಚು ಮುಖ್ಯವಾಗಿಸುತ್ತದೆ. ಒಸಿಆರ್ ಇದರೊಂದಿಗೆ ಸಹಾಯ ಮಾಡುವ ಕೆಲವು ವಿಷಯಗಳು ಇಲ್ಲಿವೆ:
- ಸ್ವಯಂಚಾಲಿತ ಡೇಟಾ ಸಂಸ್ಕರಣೆ ಮತ್ತು ದತ್ತಾಂಶ ನಮೂದು (ಉದಾಹರಣೆ: ಅರ್ಜಿದಾರರಿಗೆ ಜಾಬ್ ಅರ್ಜಿದಾರ ಟ್ರ್ಯಾಕಿಂಗ್ ಸಿಸ್ಟಮ್ಸ್)
- ಸ್ಕ್ಯಾನ್ ಮಾಡಿದ ಪುಸ್ತಕಗಳನ್ನು ಹುಡುಕಲು ಸಾಧ್ಯವಾಗುವಂತೆ ಮಾಡುವುದು
- ಕಂಪ್ಯೂಟರ್-ಓದಬಲ್ಲ ಪಠ್ಯಕ್ಕೆ ಕೈಬರಹದ ಸ್ಕ್ಯಾನ್ಗಳನ್ನು ಪರಿವರ್ತಿಸುವುದು
- ದೃಷ್ಟಿಹೀನ ಬಳಕೆದಾರರಿಗೆ ಸಹಾಯ ಮಾಡುವ ಓದುಗ ಕಾರ್ಯಕ್ರಮಗಳ ಮೂಲಕ ಡಾಕ್ಯುಮೆಂಟ್ಗಳನ್ನು ಹೆಚ್ಚು ಬಳಸಿಕೊಳ್ಳಬಹುದು
- ಐತಿಹಾಸಿಕ ದಾಖಲೆಗಳು ಮತ್ತು ವೃತ್ತಪತ್ರಿಕೆಗಳನ್ನು ಉಳಿಸಿಕೊಳ್ಳುವುದು, ಹಾಗೆಯೇ ಅವುಗಳನ್ನು ಹುಡುಕಲು ಸಾಧ್ಯವಾಗುವಂತೆ ಮಾಡುತ್ತದೆ
- ಅಕೌಂಟಿಂಗ್ ಕಾರ್ಯಕ್ರಮಗಳಿಗೆ ಡೇಟಾ ಹೊರತೆಗೆಯುವಿಕೆ ಮತ್ತು ವರ್ಗಾವಣೆ (ಉದಾಹರಣೆ: ರಸೀದಿಗಳು ಮತ್ತು ಇನ್ವಾಯ್ಸ್ಗಳು)
- ಸರ್ಚ್ ಇಂಜಿನ್ಗಳ ಬಳಕೆಗಾಗಿ ಇಂಡೆಕ್ಸ್ ಮಾಡುವ ದಾಖಲೆಗಳು
- ವೇಗದ ಕ್ಯಾಮೆರಾ ಮತ್ತು ಕೆಂಪು-ಬೆಳಕಿನ ಕ್ಯಾಮರಾ ಸಾಫ್ಟ್ವೇರ್ನಿಂದ ಚಾಲಕ ಪರವಾನಗಿ ಫಲಕಗಳನ್ನು ಗುರುತಿಸುವುದು
- ಮಾತನಾಡಲು ಸಾಧ್ಯವಾಗದ ಜನರಿಗೆ ಭಾಷಣ ಸಂಯೋಜಕ - ಸೈದ್ಧಾಂತಿಕ ಭೌತಶಾಸ್ತ್ರಜ್ಞ, ಸ್ಟೀಫನ್ ಹಾಕಿಂಗ್, ಪ್ರಾಯಶಃ ಭಾಷಣ ಸಂಶ್ಲೇಷಕ ಪ್ರೋಗ್ರಾಂನ ಅತ್ಯಂತ ಪ್ರಸಿದ್ಧ ಬಳಕೆದಾರರಾಗಿದ್ದಾರೆ
ಏಕೆ ಒಸಿಆರ್ ಬಳಸಿ?
ಏಕೆ ಚಿತ್ರವನ್ನು ತೆಗೆದುಕೊಳ್ಳಬಾರದು, ಸರಿ? ಏಕೆಂದರೆ ನೀವು ಯಾವುದನ್ನಾದರೂ ಸಂಪಾದಿಸಲು ಸಾಧ್ಯವಾಗುವುದಿಲ್ಲ ಅಥವಾ ಪಠ್ಯವನ್ನು ಹುಡುಕುವ ಕಾರಣ ಅದು ಕೇವಲ ಚಿತ್ರವಾಗಿರಬಹುದು. ಡಾಕ್ಯುಮೆಂಟ್ ಅನ್ನು ಸ್ಕ್ಯಾನ್ ಮಾಡಲಾಗುತ್ತಿದೆ ಮತ್ತು OCR ಸಾಫ್ಟ್ವೇರ್ ಅನ್ನು ಚಾಲನೆ ಮಾಡುವುದರಿಂದ ಆ ಫೈಲ್ ಅನ್ನು ನೀವು ಸಂಪಾದಿಸಬಹುದಾದ ಮತ್ತು ಹುಡುಕಲು ಸಾಧ್ಯವಾಗುವಂತೆ ಪರಿವರ್ತಿಸಬಹುದು.
ಓಸಿಆರ್ ಇತಿಹಾಸ
ಪಠ್ಯ ಗುರುತಿಸುವಿಕೆ ಅತ್ಯಂತ ಮುಂಚಿನ ಬಳಕೆಯು 1914 ಕ್ಕೆ ಮುಂಚೆಯೇ, OCR- ಸಂಬಂಧಿತ ತಂತ್ರಜ್ಞಾನಗಳ ವ್ಯಾಪಕ-ಅಭಿವೃದ್ಧಿ ಮತ್ತು ಬಳಕೆ 1950 ರ ದಶಕದಲ್ಲಿ ಶ್ರದ್ಧೆಯಿಂದ ಪ್ರಾರಂಭವಾಯಿತು, ನಿರ್ದಿಷ್ಟವಾಗಿ ಡಿಜಿಟಲಿ-ಓದಬಲ್ಲ ಪಠ್ಯಕ್ಕೆ ಪರಿವರ್ತಿಸಲು ಸುಲಭವಾದ ಸರಳೀಕೃತ ಅಕ್ಷರಶೈಲಿಯ ರಚನೆಯೊಂದಿಗೆ. ಈ ಸರಳೀಕೃತ ಅಕ್ಷರಶೈಲಿಯನ್ನು ಮೊದಲ ಬಾರಿಗೆ ಡೇವಿಡ್ ಶೆಪರ್ಡ್ ರಚಿಸಿದ ಮತ್ತು ಸಾಮಾನ್ಯವಾಗಿ OCR-7B ಎಂದು ಕರೆಯುತ್ತಾರೆ. ಕ್ರೆಡಿಟ್ ಕಾರ್ಡುಗಳು ಮತ್ತು ಡೆಬಿಟ್ ಕಾರ್ಡ್ಗಳಲ್ಲಿ ಬಳಸುವ ಪ್ರಮಾಣಿತ ಫಾಂಟ್ಗಾಗಿ ಹಣಕಾಸು ಉದ್ಯಮದಲ್ಲಿ OCR-7B ಇಂದು ಬಳಕೆಯಲ್ಲಿದೆ. 1960 ರ ದಶಕದಲ್ಲಿ, ಹಲವಾರು ದೇಶಗಳಲ್ಲಿ ಅಂಚೆ ಸೇವೆಗಳು ಒ.ಸಿ.ಆರ್ ತಂತ್ರಜ್ಞಾನವನ್ನು ಯುನೈಟೆಡ್ ಸ್ಟೇಟ್ಸ್, ಗ್ರೇಟ್ ಬ್ರಿಟನ್, ಕೆನಡಾ, ಮತ್ತು ಜರ್ಮನಿ ಸೇರಿದಂತೆ ಮೇಲ್ ವಿಂಗಡಣೆಗಾಗಿ ವೇಗವನ್ನು ಹೆಚ್ಚಿಸಲು ಪ್ರಾರಂಭಿಸಿತು. ವಿಶ್ವದಾದ್ಯಂತ ಅಂಚೆ ಸೇವೆಗಳಿಗಾಗಿ ಮೇಲ್ ಅನ್ನು ವಿಂಗಡಿಸಲು OCR ಈಗಲೂ ಸಹ ಪ್ರಮುಖ ತಂತ್ರಜ್ಞಾನವಾಗಿದೆ. 2000 ದಲ್ಲಿ, ಓಆರ್ಆರ್ ತಂತ್ರಜ್ಞಾನದ ಮಿತಿಗಳು ಮತ್ತು ಸಾಮರ್ಥ್ಯಗಳ ಪ್ರಮುಖ ಜ್ಞಾನವನ್ನು ಬಾಟ್ಗಳು ಮತ್ತು ಸ್ಪ್ಯಾಮರ್ಗಳನ್ನು ನಿಲ್ಲಿಸಲು ಬಳಸುವ ಕ್ಯಾಪ್ಚಾ ಕಾರ್ಯಕ್ರಮಗಳನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಲು ಬಳಸಲಾಯಿತು.
ದಶಕಗಳಲ್ಲಿ, ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆ , ಯಂತ್ರ ಕಲಿಕೆ , ಮತ್ತು ಕಂಪ್ಯೂಟರ್ ದೃಷ್ಟಿ ಮುಂತಾದ ಸಂಬಂಧಿತ ತಂತ್ರಜ್ಞಾನ ಪ್ರದೇಶಗಳಲ್ಲಿನ ಪ್ರಗತಿಗಳಿಂದ OCR ಹೆಚ್ಚು ನಿಖರವಾದ ಮತ್ತು ಹೆಚ್ಚು ಸುಸಂಸ್ಕೃತವಾಗಿದೆ. ಇಂದು, OCR ಸಾಫ್ಟ್ವೇರ್ ಡಾಕ್ಯುಮೆಂಟ್ ಅನ್ನು ಶೀಘ್ರವಾಗಿ ಮತ್ತು ಹೆಚ್ಚು ನಿಖರವಾಗಿ ರೂಪಾಂತರ ಮಾಡಲು ಪ್ಯಾಟರ್ನ್ ರೆಕಗ್ನಿಷನ್, ಫೀಚರ್ ಡಿಟೆಕ್ಷನ್ ಮತ್ತು ಟೆಕ್ಸ್ಟ್ ಮೈನಿಂಗ್ ಅನ್ನು ಬಳಸುತ್ತದೆ.