ಸ್ಪೀಚ್ ರೆಕಗ್ನಿಷನ್ ಎಂದರೇನು?

ಇನ್ಪುಟ್ ವಿಧಾನದಂತೆ ನಿಮ್ಮ ಧ್ವನಿ ಬಳಸಿ

ಸ್ಪೀಚ್ ರೆಕಗ್ನಿಷನ್ ಎನ್ನುವುದು ಸಿಸ್ಟಮ್ಗಳಲ್ಲಿ ಮಾತನಾಡುವ ಇನ್ಪುಟ್ಗೆ ಅನುಮತಿಸುವ ತಂತ್ರಜ್ಞಾನವಾಗಿದೆ. ನಿಮ್ಮ ಕಂಪ್ಯೂಟರ್, ಫೋನ್ ಅಥವಾ ಸಾಧನದೊಂದಿಗೆ ನೀವು ಮಾತನಾಡಿ ಮತ್ತು ಕೆಲವು ಕ್ರಮವನ್ನು ಉಂಟುಮಾಡುವ ಇನ್ಪುಟ್ನಂತೆ ನೀವು ಹೇಳಿದ ವಿಷಯವನ್ನು ಬಳಸುತ್ತದೆ. ಇತರ ವಿಧಾನಗಳಲ್ಲಿ ಟೈಪ್ ಮಾಡುವ, ಕ್ಲಿಕ್ ಮಾಡುವ ಅಥವಾ ಆಯ್ಕೆಮಾಡುವಂತಹ ಇತರ ವಿಧಾನಗಳ ವಿಧಾನಗಳನ್ನು ಬದಲಾಯಿಸಲು ತಂತ್ರಜ್ಞಾನವನ್ನು ಬಳಸಲಾಗುತ್ತಿದೆ. ಸಾಧನಗಳು ಮತ್ತು ಸಾಫ್ಟ್ವೇರ್ ಅನ್ನು ಹೆಚ್ಚು ಬಳಕೆದಾರ ಸ್ನೇಹಿ ಮತ್ತು ಉತ್ಪಾದಕತೆಯನ್ನು ಹೆಚ್ಚಿಸುವ ಸಾಧನವಾಗಿದೆ.

ದುರ್ಬಲ ವ್ಯಕ್ತಿಗಳಿಗೆ (ಕ್ರಿಪ್ಲಿಂಗ್ ಅಥವಾ ಕೈಗಳು ಅಥವಾ ಬೆರಳುಗಳಿಂದ ವ್ಯಕ್ತಿಯನ್ನು ಊಹಿಸಿ), ವೈದ್ಯಕೀಯ ಕ್ಷೇತ್ರದಲ್ಲಿ, ರೊಬೊಟಿಕ್ಸ್ ಇತ್ಯಾದಿಗಳಲ್ಲಿ ಸಹಾಯಕ್ಕಾಗಿ ಮಿಲಿಟರಿ ಸೇರಿದಂತೆ ಧ್ವನಿ ಗುರುತಿಸುವಿಕೆಗಳನ್ನು ಬಳಸುವ ಸಾಕಷ್ಟು ಅನ್ವಯಗಳು ಮತ್ತು ಪ್ರದೇಶಗಳಿವೆ. ಭವಿಷ್ಯದಲ್ಲಿ, ಕಂಪ್ಯೂಟರ್ಗಳು ಮತ್ತು ಮೊಬೈಲ್ ಫೋನ್ಗಳಂತಹ ಸಾಮಾನ್ಯ ಸಾಧನಗಳಲ್ಲಿ ಅದರ ಪ್ರಸರಣದ ಕಾರಣದಿಂದಾಗಿ ಎಲ್ಲರೂ ಭಾಷಣ ಗುರುತಿಸುವಿಕೆಗೆ ಒಳಗಾಗುತ್ತಾರೆ.

ಕೆಲವು ಸ್ಮಾರ್ಟ್ಫೋನ್ಗಳು ಧ್ವನಿ ಗುರುತಿಸುವಿಕೆಯನ್ನು ಆಸಕ್ತಿದಾಯಕವಾಗಿ ಬಳಸುತ್ತಿದ್ದಾರೆ. ಐಫೋನ್ ಮತ್ತು ಆಂಡ್ರಾಯ್ಡ್ ಸಾಧನಗಳು ಇದರ ಉದಾಹರಣೆಗಳಾಗಿವೆ. ಅವುಗಳ ಮೂಲಕ, 'ಕಾಲ್ ಆಫೀಸ್' ನಂತಹ ಮಾತನಾಡುವ ಸೂಚನೆಗಳನ್ನು ಪಡೆಯುವುದರ ಮೂಲಕ ನೀವು ಸಂಪರ್ಕಕ್ಕೆ ಕರೆಯನ್ನು ಪ್ರಾರಂಭಿಸಬಹುದು. ಇತರ ಆಜ್ಞೆಗಳನ್ನು ಸಹ 'ಬ್ಲೂಟೂತ್ ಸ್ವಿಚ್' ನಂತಹ ಮನರಂಜನೆ ಮಾಡಬಹುದು.

ಸ್ಪೀಚ್ ರೆಕಗ್ನಿಷನ್ ಸಮಸ್ಯೆ

ಸ್ಪೀಚ್ ಟು ಟೆಕ್ಸ್ಟ್ (STT) ಎಂದು ಕರೆಯಲ್ಪಡುವ ಅದರ ಆವೃತ್ತಿಯಲ್ಲಿ ಸ್ಪೀಚ್ ರೆಕಗ್ನಿಷನ್, ಮಾತನಾಡುವ ಪದಗಳನ್ನು ಪಠ್ಯವಾಗಿ ಭಾಷಾಂತರಿಸಲು ದೀರ್ಘಕಾಲದವರೆಗೆ ಬಳಸಲಾಗಿದೆ. "ನೀವು ಮಾತಾಡುತ್ತೀರಾ, ಅದು ಪ್ರಕಾರದ", ವಯಾವೋಯ್ಸ್ ಅದರ ಪೆಟ್ಟಿಗೆಯಲ್ಲಿ ಹೇಳುತ್ತದೆ. ಆದರೆ ನಾವು ತಿಳಿದಿರುವಂತೆ STT ಯೊಂದಿಗೆ ಒಂದು ಸಮಸ್ಯೆ ಇದೆ. 10 ಕ್ಕಿಂತಲೂ ಹೆಚ್ಚು ವರ್ಷಗಳ ಹಿಂದೆ, ನಾನು ವೈವಾಯ್ಸ್ ಅನ್ನು ಪ್ರಯತ್ನಿಸಿದೆ ಮತ್ತು ಅದು ನನ್ನ ಕಂಪ್ಯೂಟರ್ನಲ್ಲಿ ಒಂದು ವಾರದವರೆಗೆ ಉಳಿಯಲಿಲ್ಲ. ಯಾಕೆ? ಇದು ತೀರಾ ನಿಖರವಾಗಿಲ್ಲ ಮತ್ತು ಎಲ್ಲವನ್ನೂ ಟೈಪ್ ಮಾಡುವ ಬದಲು ಮಾತನಾಡುವ ಮತ್ತು ಸರಿಪಡಿಸುವ ಸಮಯ ಮತ್ತು ಶ್ರಮವನ್ನು ನಾನು ಕಳೆದಿದ್ದೇನೆ. ವಯಾ ವಾಯ್ಸ್ ಎಂಬುದು ಉದ್ಯಮದಲ್ಲಿ ಉತ್ತಮವಾಗಿದೆ, ಆದ್ದರಿಂದ ಉಳಿದವನ್ನು ಊಹಿಸಿ. ತಂತ್ರಜ್ಞಾನವು ಪ್ರಬುದ್ಧವಾಗಿದೆ ಮತ್ತು ಸುಧಾರಿಸಿದೆ, ಆದರೆ ಪಠ್ಯಕ್ಕೆ ಭಾಷಣವು ಇನ್ನೂ ಜನರನ್ನು ಪ್ರಶ್ನೆಗಳನ್ನು ಕೇಳುತ್ತದೆ. ಅದರ ಪ್ರಮುಖ ತೊಂದರೆಗಳಲ್ಲಿ ಒಂದಾಗಿದೆ ಜನರು ಉಚ್ಚರಿಸುವ ಪದಗಳಲ್ಲಿ ಅಪಾರ ವ್ಯತ್ಯಾಸಗಳು.

ಎಲ್ಲಾ ಭಾಷೆಗಳು ಮಾತಿನ ಗುರುತಿಸುವಿಕೆಗೆ ಒಳಗಾಗುವುದಿಲ್ಲ, ಮತ್ತು ಆಗಾಗ್ಗೆ ಆಂಗ್ಲ ಭಾಷೆಗೆ ಬೆಂಬಲವಿಲ್ಲ. ಪರಿಣಾಮವಾಗಿ, ಭಾಷಣ ಗುರುತಿಸುವಿಕೆ ಸಾಫ್ಟ್ವೇರ್ ಅನ್ನು ನಡೆಸುವ ಹೆಚ್ಚಿನ ಸಾಧನಗಳು ಇಂಗ್ಲೀಷ್ನೊಂದಿಗೆ ಮಾತ್ರ ಸಮಂಜಸವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತವೆ.

ಹಾರ್ಡ್ವೇರ್ ಅವಶ್ಯಕತೆಗಳ ಒಂದು ಸೆಟ್ ನಿರ್ದಿಷ್ಟ ಸಂದರ್ಭಗಳಲ್ಲಿ ನಿಯೋಜಿಸಲು ಮಾತಿನ ಗುರುತಿಸುವಿಕೆಗೆ ಕಷ್ಟವಾಗುತ್ತದೆ. ಹಿನ್ನೆಲೆ ಶಬ್ಧವನ್ನು ಫಿಲ್ಟರ್ ಮಾಡಲು ಸಾಕಷ್ಟು ಬುದ್ಧಿವಂತವಾದ ಮೈಕ್ರೊಫೋನ್ ಅಗತ್ಯವಿದೆ ಆದರೆ ಅದೇ ಸಮಯದಲ್ಲಿ ಸ್ವಾಭಾವಿಕವಾಗಿ ಧ್ವನಿ ಹಿಡಿಯಲು ಶಕ್ತಿಯುತವಾಗಿದೆ.

ಹಿನ್ನೆಲೆ ಶಬ್ದ ಕುರಿತು ಮಾತನಾಡುವಾಗ, ಇಡೀ ವ್ಯವಸ್ಥೆಯು ವಿಫಲಗೊಳ್ಳುತ್ತದೆ. ಇದರ ಪರಿಣಾಮವಾಗಿ, ಬಳಕೆದಾರರ ನಿಯಂತ್ರಣದಿಂದ ಹೊರಬರುವ ಶಬ್ಧಗಳಿಂದಾಗಿ ಅನೇಕ ಸಂದರ್ಭಗಳಲ್ಲಿ ವಾಕ್ ಗುರುತಿಸುವಿಕೆ ವಿಫಲಗೊಳ್ಳುತ್ತದೆ.

ಮಾಸ್ ಟೆಕ್ಸ್ಟ್ ಇನ್ಪುಟ್ಗಾಗಿನ ಉತ್ಪಾದಕ ಸಾಧನವಾಗಿರುವುದಕ್ಕಿಂತ ಹೊಸ ದೂರವಾಣಿಗಳು ಮತ್ತು VoIP ನಂತಹ ಸಂವಹನ ತಂತ್ರಜ್ಞಾನಗಳಿಗಾಗಿ ಇನ್ಪುಟ್ ವಿಧಾನವಾಗಿ ಸ್ಪೀಚ್ ರೆಕಗ್ನಿಷನ್ ಉತ್ತಮವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತಿದೆ.

ಸ್ಪೀಚ್ ರೆಕಗ್ನಿಷನ್ ಅಪ್ಲಿಕೇಶನ್ಗಳು

ಈ ತಂತ್ರಜ್ಞಾನವು ಹಲವಾರು ಕ್ಷೇತ್ರಗಳಲ್ಲಿ ಜನಪ್ರಿಯತೆಯನ್ನು ಗಳಿಸುತ್ತಿದೆ ಮತ್ತು ಕೆಳಗಿನವುಗಳಲ್ಲಿ ಯಶಸ್ವಿಯಾಗಿದೆ:

- ಸಾಧನ ನಿಯಂತ್ರಣ. ಆಂಡ್ರಾಯ್ಡ್ ಫೋನ್ಗೆ "ಸರಿ ಗೂಗಲ್" ಎಂದು ಹೇಳುವ ಮೂಲಕ ನಿಮ್ಮ ಧ್ವನಿ ಆಜ್ಞೆಗಳಿಗೆ ಎಲ್ಲಾ ಕಿವಿಗಳು ಸಿಲುಕುವ ವ್ಯವಸ್ಥೆಯನ್ನು ಹಾರಿಸುತ್ತವೆ.

- ಕಾರ್ ಬ್ಲೂಟೂತ್ ವ್ಯವಸ್ಥೆಗಳು. ಬ್ಲೂಟೂತ್ ಮೂಲಕ ನಿಮ್ಮ ಸ್ಮಾರ್ಟ್ಫೋನ್ಗೆ ರೇಡಿಯೊ ಯಾಂತ್ರಿಕತೆಯನ್ನು ಸಂಪರ್ಕಿಸುವ ವ್ಯವಸ್ಥೆಯನ್ನು ಅನೇಕ ಕಾರುಗಳು ಅಳವಡಿಸಿವೆ. ನಂತರ ನೀವು ನಿಮ್ಮ ಸ್ಮಾರ್ಟ್ಫೋನ್ ಮುಟ್ಟದೆ ಕರೆಗಳನ್ನು ಮಾಡಬಹುದು ಮತ್ತು ಸ್ವೀಕರಿಸಬಹುದು, ಮತ್ತು ಅವುಗಳನ್ನು ಹೇಳುವ ಮೂಲಕ ಸಂಖ್ಯೆಯನ್ನು ಡಯಲ್ ಮಾಡಬಹುದು.

- ಧ್ವನಿ ಪ್ರತಿಲೇಖನ. ಜನರು ಬಹಳಷ್ಟು ಟೈಪ್ ಮಾಡಬೇಕಾದ ಪ್ರದೇಶಗಳಲ್ಲಿ, ಕೆಲವು ಬುದ್ಧಿವಂತ ಸಾಫ್ಟ್ವೇರ್ಗಳು ತಮ್ಮ ಮಾತನಾಡುವ ಪದಗಳನ್ನು ಸೆರೆಹಿಡಿಯುತ್ತದೆ ಮತ್ತು ಅವುಗಳನ್ನು ಪಠ್ಯವಾಗಿ ನಕಲಿಸುತ್ತವೆ. ಇದು ಕೆಲವು ವರ್ಡ್ ಪ್ರೊಸೆಸಿಂಗ್ ಸಾಫ್ಟ್ವೇರ್ನಲ್ಲಿ ಪ್ರಸ್ತುತವಾಗಿದೆ. ಧ್ವನಿ ಪ್ರತಿಲೇಖನವು ದೃಷ್ಟಿಗೋಚರ ವಾಯ್ಸ್ಮೇಲ್ನೊಂದಿಗೆ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ .