ಆಪ್ಟಿಕಲ್ ಕ್ಯಾರೆಕ್ಟರ್ ರೆಕಗ್ನಿಷನ್ (ಒಸಿಆರ್) ಎಂದರೇನು?

ಆಪ್ಟಿಕಲ್ ಕ್ಯಾರೆಕ್ಟರ್ ರೆಕಗ್ನಿಷನ್ (OCR) ಎನ್ನುವುದು ಮುದ್ರಿತ, ಟೈಪ್ ಮಾಡಿದ ಅಥವಾ ಕೈಬರಹದ ಡಾಕ್ಯುಮೆಂಟ್ನ ಡಿಜಿಟಲ್ ಆವೃತ್ತಿಯನ್ನು ರಚಿಸುವ ಸಾಫ್ಟ್ವೇರ್ ಅನ್ನು ಸೂಚಿಸುತ್ತದೆ, ಅದು ಕಂಪ್ಯೂಟರ್ಗಳು ಹಸ್ತಚಾಲಿತವಾಗಿ ಟೈಪ್ ಮಾಡದೆಯೇ ಅಥವಾ ಪಠ್ಯವನ್ನು ನಮೂದಿಸದೆಯೇ ಓದಬಹುದು. OCR ಅನ್ನು ಸಾಮಾನ್ಯವಾಗಿ ಪಿಡಿಎಫ್ ರೂಪದಲ್ಲಿ ಸ್ಕ್ಯಾನ್ ಮಾಡಿದ ದಾಖಲೆಗಳಲ್ಲಿ ಬಳಸಲಾಗುತ್ತದೆ, ಆದರೆ ಇಮೇಜ್ ಫೈಲ್ನಲ್ಲಿ ಕಂಪ್ಯೂಟರ್-ಓದಬಲ್ಲ ಪಠ್ಯದ ಪಠ್ಯವನ್ನು ಸಹ ರಚಿಸಬಹುದು.

ಓಸಿಆರ್ ಎಂದರೇನು?

ಪಠ್ಯ ಗುರುತಿಸುವಿಕೆ ಎಂದೂ ಸಹ ಕರೆಯಲ್ಪಡುವ OCR, ಮುದ್ರಿತ ಅಥವಾ ಲಿಖಿತ ದಾಖಲೆಗಳಿಂದ ಸಂಖ್ಯೆಗಳು, ಅಕ್ಷರಗಳು ಮತ್ತು ವಿರಾಮ ಚಿಹ್ನೆಗಳು (ಸಹ ಗ್ಲಿಫ್ಗಳು ಎಂದು ಕರೆಯಲಾಗುವ) ಅಕ್ಷರಗಳನ್ನು ಪರಿವರ್ತಿಸುವ ಸಾಫ್ಟ್ವೇರ್ ತಂತ್ರಜ್ಞಾನವಾಗಿದ್ದು, ಎಲೆಕ್ಟ್ರಾನಿಕ್ ರೂಪದಲ್ಲಿ ಸುಲಭವಾಗಿ ಗುರುತಿಸಲ್ಪಡುತ್ತದೆ ಮತ್ತು ಕಂಪ್ಯೂಟರ್ಗಳು ಮತ್ತು ಇತರ ಸಾಫ್ಟ್ವೇರ್ ಕಾರ್ಯಕ್ರಮಗಳಿಂದ ಓದುತ್ತದೆ. ಒಂದು ಡಾಕ್ಯುಮೆಂಟ್ ಸ್ಕ್ಯಾನ್ ಮಾಡಲ್ಪಟ್ಟಿದೆ ಅಥವಾ ಡಿಜಿಟಲ್ ಕ್ಯಾಮೆರಾದೊಂದಿಗೆ ಛಾಯಾಚಿತ್ರ ಮಾಡಲ್ಪಟ್ಟಿದೆ ಮತ್ತು ಇತರರು ಓಸಿಆರ್ ಇಲ್ಲದೆ ಹಿಂದೆ ಸ್ಕ್ಯಾನ್ ಮಾಡಲಾದ ಅಥವಾ ಛಾಯಾಚಿತ್ರ ಮಾಡಲಾದ ಡಾಕ್ಯುಮೆಂಟ್ಗಳಿಗೆ ಈ ಪ್ರಕ್ರಿಯೆಯನ್ನು ಅನ್ವಯಿಸಬಹುದು ಎಂದು ಕೆಲವು ಓಸಿಆರ್ ಕಾರ್ಯಕ್ರಮಗಳು ಇದನ್ನು ಮಾಡುತ್ತವೆ. OCR ಬಳಕೆದಾರರಿಗೆ PDF ಡಾಕ್ಯುಮೆಂಟ್ಗಳು, ಸಂಪಾದನೆ ಪಠ್ಯ, ಮತ್ತು ಮರು-ಫಾರ್ಮ್ಯಾಟ್ ದಾಖಲೆಗಳನ್ನು ಹುಡುಕಲು ಅನುಮತಿಸುತ್ತದೆ.

ಒಸಿಆರ್ ಏನು ಬಳಸಲಾಗುತ್ತದೆ?

ತ್ವರಿತವಾಗಿ, ಪ್ರತಿ ದಿನದ ಸ್ಕ್ಯಾನಿಂಗ್ ಅಗತ್ಯತೆಗಳು, OCR ಯು ದೊಡ್ಡ ವ್ಯವಹಾರವಾಗಿರಬಾರದು. ನೀವು ಹೆಚ್ಚಿನ ಪ್ರಮಾಣದ ಸ್ಕ್ಯಾನಿಂಗ್ ಮಾಡಿದರೆ, ನಿಮಗೆ ಅಗತ್ಯವಿರುವ ನಿಖರವಾದದನ್ನು ಕಂಡುಹಿಡಿಯಲು ಪಿಡಿಎಫ್ಗಳಲ್ಲಿ ಹುಡುಕಲು ಸಾಧ್ಯವಾಗುವಷ್ಟು ಸಮಯವನ್ನು ಉಳಿಸಬಹುದು ಮತ್ತು ನಿಮ್ಮ ಸ್ಕ್ಯಾನರ್ ಪ್ರೋಗ್ರಾಂನಲ್ಲಿ ಒಸಿಆರ್ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಹೆಚ್ಚು ಮುಖ್ಯವಾಗಿಸುತ್ತದೆ. ಒಸಿಆರ್ ಇದರೊಂದಿಗೆ ಸಹಾಯ ಮಾಡುವ ಕೆಲವು ವಿಷಯಗಳು ಇಲ್ಲಿವೆ:

ಏಕೆ ಒಸಿಆರ್ ಬಳಸಿ?

ಏಕೆ ಚಿತ್ರವನ್ನು ತೆಗೆದುಕೊಳ್ಳಬಾರದು, ಸರಿ? ಏಕೆಂದರೆ ನೀವು ಯಾವುದನ್ನಾದರೂ ಸಂಪಾದಿಸಲು ಸಾಧ್ಯವಾಗುವುದಿಲ್ಲ ಅಥವಾ ಪಠ್ಯವನ್ನು ಹುಡುಕುವ ಕಾರಣ ಅದು ಕೇವಲ ಚಿತ್ರವಾಗಿರಬಹುದು. ಡಾಕ್ಯುಮೆಂಟ್ ಅನ್ನು ಸ್ಕ್ಯಾನ್ ಮಾಡಲಾಗುತ್ತಿದೆ ಮತ್ತು OCR ಸಾಫ್ಟ್ವೇರ್ ಅನ್ನು ಚಾಲನೆ ಮಾಡುವುದರಿಂದ ಆ ಫೈಲ್ ಅನ್ನು ನೀವು ಸಂಪಾದಿಸಬಹುದಾದ ಮತ್ತು ಹುಡುಕಲು ಸಾಧ್ಯವಾಗುವಂತೆ ಪರಿವರ್ತಿಸಬಹುದು.

ಓಸಿಆರ್ ಇತಿಹಾಸ

ಪಠ್ಯ ಗುರುತಿಸುವಿಕೆ ಅತ್ಯಂತ ಮುಂಚಿನ ಬಳಕೆಯು 1914 ಕ್ಕೆ ಮುಂಚೆಯೇ, OCR- ಸಂಬಂಧಿತ ತಂತ್ರಜ್ಞಾನಗಳ ವ್ಯಾಪಕ-ಅಭಿವೃದ್ಧಿ ಮತ್ತು ಬಳಕೆ 1950 ರ ದಶಕದಲ್ಲಿ ಶ್ರದ್ಧೆಯಿಂದ ಪ್ರಾರಂಭವಾಯಿತು, ನಿರ್ದಿಷ್ಟವಾಗಿ ಡಿಜಿಟಲಿ-ಓದಬಲ್ಲ ಪಠ್ಯಕ್ಕೆ ಪರಿವರ್ತಿಸಲು ಸುಲಭವಾದ ಸರಳೀಕೃತ ಅಕ್ಷರಶೈಲಿಯ ರಚನೆಯೊಂದಿಗೆ. ಈ ಸರಳೀಕೃತ ಅಕ್ಷರಶೈಲಿಯನ್ನು ಮೊದಲ ಬಾರಿಗೆ ಡೇವಿಡ್ ಶೆಪರ್ಡ್ ರಚಿಸಿದ ಮತ್ತು ಸಾಮಾನ್ಯವಾಗಿ OCR-7B ಎಂದು ಕರೆಯುತ್ತಾರೆ. ಕ್ರೆಡಿಟ್ ಕಾರ್ಡುಗಳು ಮತ್ತು ಡೆಬಿಟ್ ಕಾರ್ಡ್ಗಳಲ್ಲಿ ಬಳಸುವ ಪ್ರಮಾಣಿತ ಫಾಂಟ್ಗಾಗಿ ಹಣಕಾಸು ಉದ್ಯಮದಲ್ಲಿ OCR-7B ಇಂದು ಬಳಕೆಯಲ್ಲಿದೆ. 1960 ರ ದಶಕದಲ್ಲಿ, ಹಲವಾರು ದೇಶಗಳಲ್ಲಿ ಅಂಚೆ ಸೇವೆಗಳು ಒ.ಸಿ.ಆರ್ ತಂತ್ರಜ್ಞಾನವನ್ನು ಯುನೈಟೆಡ್ ಸ್ಟೇಟ್ಸ್, ಗ್ರೇಟ್ ಬ್ರಿಟನ್, ಕೆನಡಾ, ಮತ್ತು ಜರ್ಮನಿ ಸೇರಿದಂತೆ ಮೇಲ್ ವಿಂಗಡಣೆಗಾಗಿ ವೇಗವನ್ನು ಹೆಚ್ಚಿಸಲು ಪ್ರಾರಂಭಿಸಿತು. ವಿಶ್ವದಾದ್ಯಂತ ಅಂಚೆ ಸೇವೆಗಳಿಗಾಗಿ ಮೇಲ್ ಅನ್ನು ವಿಂಗಡಿಸಲು OCR ಈಗಲೂ ಸಹ ಪ್ರಮುಖ ತಂತ್ರಜ್ಞಾನವಾಗಿದೆ. 2000 ದಲ್ಲಿ, ಓಆರ್ಆರ್ ತಂತ್ರಜ್ಞಾನದ ಮಿತಿಗಳು ಮತ್ತು ಸಾಮರ್ಥ್ಯಗಳ ಪ್ರಮುಖ ಜ್ಞಾನವನ್ನು ಬಾಟ್ಗಳು ಮತ್ತು ಸ್ಪ್ಯಾಮರ್ಗಳನ್ನು ನಿಲ್ಲಿಸಲು ಬಳಸುವ ಕ್ಯಾಪ್ಚಾ ಕಾರ್ಯಕ್ರಮಗಳನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಲು ಬಳಸಲಾಯಿತು.

ದಶಕಗಳಲ್ಲಿ, ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆ , ಯಂತ್ರ ಕಲಿಕೆ , ಮತ್ತು ಕಂಪ್ಯೂಟರ್ ದೃಷ್ಟಿ ಮುಂತಾದ ಸಂಬಂಧಿತ ತಂತ್ರಜ್ಞಾನ ಪ್ರದೇಶಗಳಲ್ಲಿನ ಪ್ರಗತಿಗಳಿಂದ OCR ಹೆಚ್ಚು ನಿಖರವಾದ ಮತ್ತು ಹೆಚ್ಚು ಸುಸಂಸ್ಕೃತವಾಗಿದೆ. ಇಂದು, OCR ಸಾಫ್ಟ್ವೇರ್ ಡಾಕ್ಯುಮೆಂಟ್ ಅನ್ನು ಶೀಘ್ರವಾಗಿ ಮತ್ತು ಹೆಚ್ಚು ನಿಖರವಾಗಿ ರೂಪಾಂತರ ಮಾಡಲು ಪ್ಯಾಟರ್ನ್ ರೆಕಗ್ನಿಷನ್, ಫೀಚರ್ ಡಿಟೆಕ್ಷನ್ ಮತ್ತು ಟೆಕ್ಸ್ಟ್ ಮೈನಿಂಗ್ ಅನ್ನು ಬಳಸುತ್ತದೆ.