ಲಿನಕ್ಸ್ ಧ್ವನಿ ಗುರುತಿಸುವಿಕೆ ರಾಜ್ಯ

ಪರಿಚಯ

ನಾನು ಲೇಖನಗಳು ಸಂಶೋಧನೆ ಬಹಳಷ್ಟು ಸಮಯವನ್ನು ಕಳೆಯುತ್ತಿದ್ದೇನೆ ಮತ್ತು ಅನೇಕವೇಳೆ ರೈಲು ನಿಲ್ದಾಣಕ್ಕೆ ಅಥವಾ ಸಾಮಾನ್ಯವಾಗಿ ಮತ್ತು ಹೊರಗೆ ಸಾಮಾನ್ಯವಾಗಿ ನಡೆಯುವಾಗ ಲೇಖನದ ವಿಷಯದ ಕುರಿತು ನಾನು ಯೋಚಿಸುತ್ತೇನೆ.

ಒಂದು ಸಂಜೆ 1.5 ಮೈಲುಗಳವರೆಗೆ ನನ್ನ ಕೆಲಸದಿಂದ ನಿಲ್ದಾಣಕ್ಕೆ ವಾಕಿಂಗ್ ಮಾಡುವಾಗ ನಾನು "ನಾನು ಹೇಳಬೇಕೆಂದಿರುವದನ್ನು ರೆಕಾರ್ಡ್ ಮಾಡಬಹುದಾಗಿರುತ್ತದೆ ಮತ್ತು ನಂತರ ಅದನ್ನು ಸಂಪಾದಿಸಲು ಮತ್ತು ನಂತರದಲ್ಲಿ ರೂಪಿಸಲು ಸಾಧ್ಯವಾಗುವ ಒಂದು ಪಠ್ಯ ಕಡತಕ್ಕೆ ಸ್ವಯಂಚಾಲಿತವಾಗಿ ನಕಲಿಸಲು ಸಾಧ್ಯವಾದರೆ ಅದು ಒಳ್ಳೆಯದು" .

ಲಿನಕ್ಸ್ನಲ್ಲಿ ಡಿಕ್ಟೇಷನ್ ಸಾಫ್ಟ್ವೇರ್ ಅನ್ನು ಬಳಸಿಕೊಂಡು ಮೈಕ್ರೊಫೋನ್ ಮೂಲಕ ನೇರವಾಗಿ ರೆಕಾರ್ಡಿಂಗ್ ಸೇರಿದಂತೆ ಧ್ವನಿ ರೆಕಗ್ನಿಷನ್ ಮತ್ತು ಡಿಕ್ಟೇಷನ್ಗೆ ಲಭ್ಯವಿರುವ ವಿವಿಧ ಆಯ್ಕೆಗಳನ್ನು ನೋಡುವಂತೆ ನಾನು ಹಲವು ಗಂಟೆಗಳ ಕಾಲ ಕಳೆದಿದ್ದೇನೆ, ಫೈಲ್ ಅನ್ನು MP3 ಅಥವಾ WAV ಫಾರ್ಮ್ಯಾಟ್ಗೆ ರೆಕಾರ್ಡಿಂಗ್ ಮಾಡಿ ಮತ್ತು ಕಮಾಂಡ್ ಲೈನ್ ಮೂಲಕ ಅದನ್ನು ಪರಿವರ್ತಿಸುವ ಮೂಲಕ Chrome ಅನ್ನು ಬಳಸಿ ಮತ್ತು ಆಂಡ್ರಾಯ್ಡ್ ಅಪ್ಲಿಕೇಶನ್ಗಳು.

ಈ ಲೇಖನಗಳು ಹಾರ್ಡ್ ಕಾರ್ಮಿಕ ದಿನಗಳ ನಂತರ ನನ್ನ ಸಂಶೋಧನೆಗಳನ್ನು ತೋರಿಸುತ್ತದೆ.

ಲಿನಕ್ಸ್ ಆಯ್ಕೆಗಳು

ಲಿನಕ್ಸ್ನಲ್ಲಿ ಡಿಕ್ಟೇಷನ್ ಮತ್ತು ವಾಯ್ಸ್ ರೆಕಗ್ನಿಷನ್ ಸಾಫ್ಟ್ವೇರ್ ಅನ್ನು ಹುಡುಕಲು ಪ್ರಯತ್ನಿಸುತ್ತಿರುವುದು ಸುಲಭವಲ್ಲ ಮತ್ತು ಲಭ್ಯವಿರುವ ಆಯ್ಕೆಗಳನ್ನು ಬುದ್ಧಿವಂತವಾಗಿಲ್ಲ.

ಈ ವಿಕಿಪೀಡಿಯ ಪುಟವು CMU ಸ್ಫಿಂಕ್ಸ್, ಜೂಲಿಯಸ್ ಮತ್ತು ಸೈಮನ್ ಸೇರಿದಂತೆ ಸಂಭಾವ್ಯ ಆಯ್ಕೆಗಳ ಪಟ್ಟಿಯನ್ನು ಹೊಂದಿದೆ.

ನಾನು ಕ್ಷಣದಲ್ಲಿ ಡೆಬಿಯನ್ ಪರೀಕ್ಷೆಯನ್ನು ಆಧರಿಸಿದ ಸ್ಪಾರ್ಕಿಲಿನಕ್ಸ್ ಅನ್ನು ಬಳಸುತ್ತಿದ್ದೇನೆ ಮತ್ತು ರೆಪೊಸಿಟರಿಯಲ್ಲಿ ಲಭ್ಯವಿರುವ ಧ್ವನಿ ಗುರುತಿಸುವಿಕೆ ಪ್ಯಾಕೇಜ್ ಸ್ಫಿಂಕ್ಸ್ ಮಾತ್ರ ಎಂದು ನಾನು ನಿಮಗೆ ಹೇಳಬಲ್ಲೆ.

ಅಲಾಸ್ಕಾ ಲಿನಕ್ಸ್ ಪ್ರೊಗ್ರಾಮ್ಗಳು ಪಾಕೆಟ್ಸ್ಫಿಂಕ್ಸ್ ಎಂದು ನಾನು ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದೇನೆ, ಇದು ನಾನು WAV ಫೈಲ್ಗಳನ್ನು ಪಠ್ಯಕ್ಕೆ ಪರಿವರ್ತಿಸಲು ಬಳಸಿದೆ ಮತ್ತು ಫ್ರೀಸ್ಪೀಕ್- VR ಇದು ಮೈಕ್ರೋಫೋನ್ನಿಂದ ನೇರವಾಗಿ ರೆಕಾರ್ಡ್ ಮಾಡಲು ಸಾಧ್ಯವಾಗುವ ಪೈಥಾನ್ ಅಪ್ಲಿಕೇಶನ್ ಆಗಿದೆ.

ನಾನು ವಾಯ್ಸ್ ನೋಟ್ II ಮತ್ತು ಡಿಕ್ಟಾನೋಟ್ ಸೇರಿದಂತೆ ಕೆಲವು ಕ್ರೋಮ್ ಅಪ್ಲಿಕೇಶನ್ಗಳನ್ನು ಸಹ ಪ್ರಯತ್ನಿಸಿದೆ.

ಅಂತಿಮವಾಗಿ ನಾನು "ಡಿಕ್ಟೇಷನ್ ಮತ್ತು ಇಮೇಲ್" ಮತ್ತು "ಟಾಕ್ ಆಂಡ್ ಟಾಕ್ ಡಿಕ್ಟೇಷನ್" ಆಂಡ್ರಾಯ್ಡ್ ಅಪ್ಲಿಕೇಶನ್ಗಳನ್ನು ಪ್ರಯತ್ನಿಸಿದೆ.

ಫ್ರೀಸ್ಪೀಕ್- VR

ಸ್ಟ್ಯಾಂಡರ್ಡ್ ರೆಪೊಸಿಟರಿಗಳಲ್ಲಿ ಫ್ರೀಸ್ಪೀಕ್-ವಿಆರ್ ಲಭ್ಯವಿಲ್ಲ. ನಾನು ಇಲ್ಲಿಂದ ಫೈಲ್ಗಳನ್ನು ಡೌನ್ಲೋಡ್ ಮಾಡಿದ್ದೇನೆ.

ಜಿಪ್ ಫೈಲ್ನ ವಿಷಯಗಳನ್ನು ಡೌನ್ಲೋಡ್ ಮಾಡಿದ ನಂತರ ಹೊರತೆಗೆದ ನಂತರ ನಾನು ಟರ್ಮಿನಲ್ ಅನ್ನು ತೆರೆಯಿತು ಮತ್ತು ಫೈಲ್ಗಳನ್ನು ಹೊರತೆಗೆಯಲಾದ ಫೋಲ್ಡರ್ಗೆ ನ್ಯಾವಿಗೇಟ್ ಮಾಡಿದೆ.

ಫ್ರೀಸ್ಪೀಕ್-ವಿಆರ್ ತೆರೆಯಲು ನಾನು ಕೆಳಗಿನ ಆಜ್ಞೆಯನ್ನು ಟೈಪ್ ಮಾಡಿದ್ದೇನೆ.

ಸುಡೋ ಪೈಥಾನ್ ಫ್ರೀಸ್ಪೀಕ್-ವಿಆರ್

ಸಾಕಷ್ಟು ಯೋಗ್ಯವಾದ ಮೈಕ್ರೊಫೋನ್ ಮತ್ತು ಹೆಚ್ಚೆಚ್ಚು ತೆರನಾದ ದಕ್ಷಿಣ ಇಂಗ್ಲಿಷ್ ಉಚ್ಚಾರಣೆ ಹೊಂದಿರುವ ಹೆಡ್ಫೋನ್ಗಳನ್ನು ನಾನು ಹೊಂದಿದ್ದೇನೆ.

ಕೆಳಗಿನ ಪಠ್ಯವು ಫ್ರೀಸ್ಪೀಕ್-ವಿರ್ ವಿಂಡೋದಲ್ಲಿ ಕಾಣಿಸಿಕೊಂಡಿದೆ:

ಫಲಿತಾಂಶದ ಘಟಕಗಳ ನಾಯಿಗಳಿಗೆ ಸುಸ್ವಾಗತ ಇಂದು ವ್ಯವಸ್ಥಾಪಕ ಪರೀಕ್ಷೆಗಳಿಗೆ ಹೇಗೆ ಖಾತರಿ ಮಾಡಬೇಕೆಂಬುದು ಪರೀಕ್ಷಿಸಬೇಕಾಗಿದೆ ಪಠ್ಯವನ್ನು ಬಳಸುವಾಗ ವ್ಯವಸ್ಥೆಯನ್ನು ಬಳಸುವುದು ನಾನು ಒಬ್ಬರಿಗೆ ಪ್ರತಿಯೊಬ್ಬರಿಗೂ ಮಾತ್ರ ಉಳಿಯುವುದು ಒಂದು ಕೋಳಿಗಳ ಅರ್ಥಕ್ಕೆ ಗೋಲ್ಡನ್ ಸಿಸ್ಟಮ್ ಆಗಿ ಇಯಾ ಇದು ನನ್ನ ಮುಂದಿನ ಹೆಸರು ಕರೆ ಫೋನ್ ಆಗಾಗ ಈ ಫೈಲ್ ಶೀಘ್ರದಲ್ಲೇ ಸಾಕಷ್ಟು ಸಂದರ್ಭಗಳಲ್ಲಿ ಫೋನ್ ಹ್ಯಾಂಡ್ಸ್- ಸ್ಪೇಸ್ ಸಿಂಹನಾರಿ ಗೋಯಿಂಗ್ ಇದು ಒಂದು ಫೋನ್ ಹಂಚಲಾಗುವುದಿಲ್ಲ ತರಬೇತಿ ಮತ್ತು ಮತ್ತು ಉಪಕರಣಗಳು ಮಾತನಾಡುವ ಬಳಸಿ ನೀವು ಮುಗಿಸಿದಾಗ ಒಂದು ಬಳಸಲಾಗುತ್ತದೆ ಫೈಲ್ ಹೇಳುತ್ತಾರೆ ಕೊನೆಯ ಕಥೆ A ಮತ್ತು ಬಳಸಿಕೊಂಡು ಒಂದು ಮೂಲಕ ಇದು ಎಷ್ಟು ಯಶಸ್ವಿಯಾಗಿದೆ ಈ ಲಿನಕ್ಸ್ ಎಂದು ನೀವು ತಪ್ಪಿಸಲು ಇಲ್ಲ

ಈಗ ಇದು ಯುನಿಟ್ ಆಫ್ ಡಾಗ್ಸ್ ವೆಬ್ಸೈಟ್ ಅಲ್ಲ ಎಂದು ನಾನು ಈಗ ಹೇಳಲು ಬಯಸುತ್ತೇನೆ ಮತ್ತು ಯಾವುದೇ ಸಮಯದಲ್ಲಿ ನಾನು ಗೋಲ್ಡನ್ ಕೋಳಿಗಳೊಂದಿಗೆ ಏನು ಮಾಡಬೇಕೆಂದು ಹೇಳಿದ್ದೆ. ನಾನು ಧ್ವನಿ ಗುರುತಿಸುವಿಕೆ ತಂತ್ರಾಂಶವನ್ನು ಬಳಸುವ ಪ್ರಕ್ರಿಯೆಯನ್ನು ವಿವರಿಸಲು ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದೆ.

ನಾನು ಪಿಚ್ ಮತ್ತು ವೇಗವನ್ನು ಒಳಗೊಂಡಂತೆ ಕೆಲವು ಬಾರಿ ಸಾಫ್ಟ್ವೇರ್ ಅನ್ನು ಪ್ರಯತ್ನಿಸಿದೆ ಆದರೆ ನಿಖರತೆ ಕಳಪೆಯಾಗಿತ್ತು.

ಪಾಕೆಟ್ಸ್ಫಿಂಕ್ಸ್

ಪಾಕೆಟ್ ಎಸ್ಪಿಂಕ್ಸ್ ಒಂದು WAV ಕಡತವನ್ನು ತೆಗೆದುಕೊಳ್ಳಲು ಮತ್ತು ಆಜ್ಞಾ ಸಾಲಿನ ಮೂಲಕ ಪಠ್ಯಕ್ಕೆ ಪರಿವರ್ತಿಸಲು ಸಾಧ್ಯವಾಗುತ್ತದೆ.

ಪಾಕೆಟ್ ಸ್ಫಿಂಕ್ಸ್ ಡೆಬಿಯನ್ ರೆಪೊಸಿಟರಿಗಳ ಮೂಲಕ ಲಭ್ಯವಿದೆ ಮತ್ತು ಹೆಚ್ಚಿನ ವಿತರಣೆಗಳಿಗೆ ಲಭ್ಯವಿರಬೇಕು.

ಧ್ವನಿ ಗುರುತಿಸುವಿಕೆ, ಭಾಷೆ ಫೈಲ್ಗಳು, ನಿಘಂಟುಗಳು ಮತ್ತು ವ್ಯವಸ್ಥೆಯನ್ನು ಹೇಗೆ ತರಬೇತಿ ಮಾಡುವುದು ಎಂಬ ಪರಿಕಲ್ಪನೆಗಳಲ್ಲಿ ನಿಮಗೆ ನಿಜವಾಗಿಯೂ ಪದವಿ ಬೇಕಾಗುತ್ತದೆ ಎಂಬುದು ಪಾಕೆಟ್ ಸ್ಪಿಂಕ್ಸ್ನೊಂದಿಗೆ ನಾನು ಕಂಡುಕೊಂಡ ಪ್ರಮುಖ ವಿಷಯವಾಗಿದೆ.

ಪಾಕೆಟ್ ಸ್ಪಿಂಕ್ಸ್ ಅನ್ನು ಸ್ಥಾಪಿಸಿದ ನಂತರ ನೀವು ಸಿಎಂಯು ಸಿಂಹನಾಕ್ಸ್ ವೆಬ್ಸೈಟ್ಗೆ ಹೋಗಬೇಕು ಮತ್ತು ಸಾಧ್ಯವಾದಷ್ಟು ಹೆಚ್ಚಿನ ಮಾಹಿತಿಯನ್ನು ಓದಬೇಕು. ನೀವು ಕೆಳಗಿನ ಮಾದರಿ ಫೈಲ್ ಅನ್ನು ಕೂಡ ಡೌನ್ಲೋಡ್ ಮಾಡಬೇಕಾಗಿದೆ.

(ನೀವು ಸ್ಥಳೀಯ ಇಂಗ್ಲಿಷ್ ಸ್ಪೀಕರ್ ಅಲ್ಲದಿದ್ದರೆ, ನಿಮಗೆ ಸೂಕ್ತವಾದ ಭಾಷಾ ಮಾದರಿಯನ್ನು ಆಯ್ಕೆ ಮಾಡಿ).

ಸಾಮಾನ್ಯವಾಗಿ ಪಾಕೆಟ್ಸ್ಫಿಂಕ್ಸ್ ಮತ್ತು ಸ್ಫಿಂಕ್ಸ್ಗೆ ಸಂಬಂಧಿಸಿದ ದಾಖಲೆಯು ಲೇ ವ್ಯಕ್ತಿಗಾಗಿ ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವುದು ಕಷ್ಟ ಆದರೆ ಸಂಭಾವ್ಯ ಉಚ್ಚಾರಣೆಗಳ ಪಟ್ಟಿಯನ್ನು ಹೊಂದಿರುವ ಸಂಭವನೀಯ ಪದಗಳು ಮತ್ತು ಭಾಷೆಯ ಮಾದರಿಗಳ ಪಟ್ಟಿಯನ್ನು ಒದಗಿಸಲು ನಿಘಂಟಿನ ಫೈಲ್ಗಳನ್ನು ನಾನು ಬಳಸಬಹುದಾಗಿರುತ್ತದೆ.

ಪಾಕೆಟ್ಸ್ಫಿಂಕ್ಸ್ ಪರೀಕ್ಷಿಸಲು ನಾನು ನನ್ನ ಸ್ವಂತ ಧ್ವನಿಯ ರೆಕಾರ್ಡಿಂಗ್ ಅನ್ನು ಬಳಸುತ್ತಿದ್ದೆ, ಅಲ್ ಪಸಿನೊವಿನಿಂದ "ಡೆವಿಲ್ಸ್ ಅಡ್ವೊಕೇಟ್" ಮತ್ತು "ಮೋರ್ಗನ್ ಫ್ರೀಮನ್" ನಿಂದ ಸ್ನಿಪೆಟ್ನ ತುಣುಕನ್ನು ಬಳಸಿದ್ದೇನೆ. ಇದರ ಅರ್ಥ ವಿಭಿನ್ನ ಧ್ವನಿಯನ್ನು ಪ್ರಯತ್ನಿಸುತ್ತದೆ ಮತ್ತು ನನಗೆ ಮೋರ್ಗನ್ ಫ್ರೀಮನ್ನಂತೆ ಕಥೆಯನ್ನು ಹೇಳಲು ಯಾರೂ ಇರುವುದಿಲ್ಲ ಮತ್ತು ಯಾರೂ ಅಲ್ ಪಸಿನೊನಂತಹ ಮಾರ್ಗವನ್ನು ನೀಡುವುದಿಲ್ಲ.

ಪಾಕೆಟ್ ಸ್ಪಿಂಕ್ಸ್ಗೆ ಕೆಲಸ ಮಾಡಲು ಇದು WAV ಫೈಲ್ನ ಅಗತ್ಯವಿದೆ ಮತ್ತು ಇದು ಒಂದು ನಿರ್ದಿಷ್ಟ ಸ್ವರೂಪದಲ್ಲಿರಬೇಕು. ಫೈಲ್ MP3 ಸ್ವರೂಪದಲ್ಲಿದ್ದರೆ ffmpeg ಆದೇಶವನ್ನು ಅದನ್ನು WAV ಸ್ವರೂಪಕ್ಕೆ ಪರಿವರ್ತಿಸಲು ಬಳಸಿಕೊಳ್ಳಿ:

ffmpeg -i ಇನ್ಪುಟ್ಫೈಲ್ನೇಮ್.ಎಂಪಿ 3-ಅಕೋಡೆಕ್ pcm_s16le -ar 16000 outputfilename.wav

PocketSphinx ಅನ್ನು ಚಲಾಯಿಸಲು ಈ ಕೆಳಗಿನ ಆಜ್ಞೆಯನ್ನು ಬಳಸಿ:

pocketsphinx_continuous -dict /usr/share/pocketsphinx/model/lm/en_US/cmu07a.dic-infile voice2.wav -lm cmusphinx-5.0-en-us.lm 2> voice2.log

pocketsphinx_continuous ಒಂದು WAV ಕಡತವನ್ನು ತೆಗೆದುಕೊಳ್ಳುತ್ತದೆ ಮತ್ತು ಅದನ್ನು ಪಠ್ಯಕ್ಕೆ ಪರಿವರ್ತಿಸುತ್ತದೆ.

ಪಾಕೆಟ್ಸ್ಫಿನ್ಕ್ಸ್ ಮೇಲಿನ ಆಜ್ಞೆಯಲ್ಲಿ "/usr/share/pocketsphinx/model/lm/en_US/cmu07a.dic" ಎಂಬ ಶಬ್ದಕೋಶವನ್ನು ಬಳಸುವ ಭಾಷೆಗೆ "cmusphinx-5.0-en-us.lm" ಎಂಬ ಭಾಷೆಯ ಮಾದರಿಯೊಂದಿಗೆ ಹೇಳಲಾಗುತ್ತದೆ. ಪಠ್ಯಕ್ಕೆ ಪರಿವರ್ತಿಸಲಾಗುವ ಫೈಲ್ ಅನ್ನು ಧ್ವನಿ 2.ವಾವ್ ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ (ಇದು ನನ್ನ ಧ್ವನಿಯೊಂದಿಗೆ ನಾನು ಮಾಡಿದ ರೆಕಾರ್ಡಿಂಗ್ ಆಗಿದೆ). ಅಂತಿಮವಾಗಿ 2> ನಿಮಗೆ ಅಗತ್ಯವಿರುವ ಎಲ್ಲಾ ಶಬ್ದಸಂಗ್ರಹದ ಔಟ್ಪುಟ್ಗಳನ್ನು ಧ್ವನಿ ಕಡತದೊಳಗೆ ಜೋಡಿಸಬೇಕಾಗುತ್ತದೆ. ಪರೀಕ್ಷೆಯ ನೈಜ ಫಲಿತಾಂಶಗಳು ಟರ್ಮಿನಲ್ ವಿಂಡೋದಲ್ಲಿ ಪ್ರದರ್ಶಿಸುತ್ತದೆ.

ನನ್ನ ಧ್ವನಿಯನ್ನು ಬಳಸುವ ಫಲಿತಾಂಶಗಳು ಹೀಗಿವೆ:

ಒಂದು ನಿಮಿಷದಲ್ಲಿ ಯಾವ ಮಾನ್ಯತೆ ಸಾಫ್ಟ್ವೇರ್ ಬಗ್ಗೆ ಈ ವಾರದ ವಿಷಯದ ಬಗ್ಗೆ ಮುಂದಿನದನ್ನು ಸ್ವಾಗತಿಸಿ

ಫಲಿತಾಂಶಗಳು ಫ್ರೀಸ್ಪೀಕ್-ವಿಆರ್ನಂತೆ ಭಯಾನಕವಲ್ಲ ಆದರೆ ಇನ್ನೂ ನಿಜವಾಗಿಯೂ ಬಳಸಲಾಗುವುದಿಲ್ಲ. ನಾನು ನಂತರ ಪಾಕೆಟ್ಸ್ಫಿಂಕ್ಸ್ ಅನ್ನು ಆಲ್ ಪಸಿನೊನೊಂದಿಗೆ ಉಪಯೋಗಿಸಲು ಪ್ರಯತ್ನಿಸಿದೆ ಆದರೆ ಇದು ಯಾವುದೇ ಫಲಿತಾಂಶಗಳನ್ನು ಮರಳಿಲ್ಲ.

ಅಂತಿಮವಾಗಿ ನಾನು "ಬ್ರೂಸ್ ಆಲ್ಮೈಟಿ" ಚಿತ್ರದಿಂದ ಮೋರ್ಗನ್ ಫ್ರೀಮನ್ರ ಧ್ವನಿಯನ್ನು ಉಪಯೋಗಿಸಲು ಪ್ರಯತ್ನಿಸಿದೆ ಮತ್ತು ಇಲ್ಲಿ ಫಲಿತಾಂಶಗಳು:

000000000: ನಾವು ಅವಳ ಮೇಲೆ ಮಾಡುತ್ತೇವೆ
000000001: ಎಲ್ಲ ಕಠಿಣ ಹೌದು ಹೌದು ಇದೀಗ ಈ ದಿನ ನಾವು ಜೀವಂತವಾಗಿರುವುದರಿಂದ ನಾನು ಬಿಸಿಯಾಗಿ ಭಾಗವಾಗಿರುತ್ತೇನೆ
000000002: ಎಲಿವೇಟರ್ನಲ್ಲಿ ಬೇಸ್ಬಾಲ್ ಗಂಟೆಯ ಸ್ವಲ್ಪವೇ ಪ್ರಮುಖವಾದದ್ದು ಅಥವಾ ಜೀವನದಲ್ಲಿ ಏನು ಮಾಡಬೇಕೆಂದು ತಿಳಿಯುವುದು
000000003: ಚೇತರಿಸಿಕೊಳ್ಳುವಂತಹವುಗಳು ಯಾವುವು
000000004: ಅವರು ಇದನ್ನು ಬರೆದಿಲ್ಲ
000000005: ಅವರು ನನ್ನ ಮೇಲೆ ಹಕ್ಕನ್ನು ಹೊಂದಿದ್ದಾರೆ
000000006: ನೀವು ನಿಯಮಗಳನ್ನು ಹೊಂದಿರಬೇಕು
000000007: ನಾನು ನಿಮ್ಮನ್ನು ನಿರೀಕ್ಷಿಸುತ್ತಿದ್ದೇನೆ
000000008: ಮತ್ತು ಕೊಲೆಗಾರ ಕ್ರಿಸ್ಮಸ್ ಪಕ್ಷವು ಒಂದು ವಿವರಣೆ ಎಂದು ಅವರು ಇಲ್ಲಿ ಕಲಿತರು
000000009: ಇದು ಒ ಬರೆಯಲು ಬರೆಯಲು ಒಂದು ಮಾರ್ಗವಾಗಿದೆ. ಕತ್ತೆ ನಾನು ಯಾವಾಗಲೂ ಒಂದು ಧರಿಸುತ್ತಾರೆ ಭಾವಿಸಲಾಗಿದೆ
000000010: ಯುನಿಟೆಡ್ನ ಸಮಸ್ಯೆಯಂತೆ ಅವರು ನಾನು ಆ ಸಮಯದಲ್ಲಿ ಒಳ್ಳೆಯದನ್ನು ನೀಡುವುದಿಲ್ಲ, ನಾನು ಪ್ರಪಂಚದಲ್ಲಿ ನಾನು ಭಾವಿಸುತ್ತೇನೆ ಎಂದು ನಾವು ಭಾವಿಸಲಿಲ್ಲ ಮತ್ತು ನಾನು ಅದನ್ನು ನೋಡಿದ್ದೇನೆ
000000011: ಇದು ಹೊಂದಿರುವ ತಂದೆ
000000012: ಇದರ ಬಗ್ಗೆ ಸಾಕಷ್ಟು
000000013: ಇದು ನೀಡಿದೆ
000000014: ನೀವು ಸಾಕಷ್ಟು ಬರುವುದಿಲ್ಲ ಎಂದು ನೀವು ಎಲ್ಲವನ್ನೂ
000000015: ಶರತ್ಕಾಲದಲ್ಲಿ
000000016: ನನಗೆ ಮಾತ್ರ ಹಿಡಿದುಕೊಳ್ಳಿ
000000017: ನಾನು ಮದುವೆಯಾಗುವವರೆಲ್ಲರೂ ಆ ರೀತಿ ಇರಲಿಲ್ಲ ಎಂದು ನಾನು ಯೋಚಿಸಿದ್ದೆನೋ ಎಂದು ಅತೃಪ್ತಿಗೊಂಡಿದ್ದೇನೆಂದರೆ, ನಾವು ಬೇರೆ ರೀತಿಯಲ್ಲಿ ಇಷ್ಟಪಡುತ್ತೇವೆ

ನನ್ನ ಪರೀಕ್ಷೆಯನ್ನು ವೈಜ್ಞಾನಿಕವಾಗಿ ಪರಿಗಣಿಸಲಾಗುವುದಿಲ್ಲ ಮತ್ತು ಪಾಕೆಟ್ ಎಸ್ಪಿಂಕ್ಸ್ ಅಭಿವರ್ಧಕರು ನಾನು ಸಾಫ್ಟ್ವೇರ್ ಅನ್ನು ಸರಿಯಾಗಿ ಬಳಸುತ್ತಿಲ್ಲ ಎಂದು ಹೇಳಬಹುದು. ಉತ್ತಮ ಶಬ್ದಕೋಶ ಮತ್ತು ಭಾಷೆ ಫೈಲ್ಗಳನ್ನು ರಚಿಸಲು ಬಳಸಬಹುದಾದ ಧ್ವನಿ ತರಬೇತಿ ಎಂಬ ತಂತ್ರವೂ ಸಹ ಇದೆ.

ನನ್ನ ಅತಿಯಾದ ಅಭಿಪ್ರಾಯವೆಂದರೆ ಇದು ದೈನಂದಿನ ಬಳಕೆಗೆ ತುಂಬಾ ಕಷ್ಟಕರವಾಗಿದೆ.

ವಾಯ್ಸ್ ನೋಟ್ II

ಧ್ವನಿ ಧ್ವನಿ II ಎಂಬುದು Google ಧ್ವನಿ ಗುರುತಿಸುವಿಕೆ API ಅನ್ನು ಬಳಸುವ Chrome ಅಪ್ಲಿಕೇಶನ್ ಆಗಿದೆ.

ನೀವು Chrome ಅಥವಾ Chromium ಬ್ರೌಸರ್ಗಳನ್ನು ಬಳಸುತ್ತಿದ್ದರೆ ನೀವು ವೆಬ್ ಅಂಗಡಿಯ ಮೂಲಕ ಧ್ವನಿಮುದ್ರಿಕೆ II ಅನ್ನು ಸ್ಥಾಪಿಸಬಹುದು.

ವಾಯ್ಸ್ ನೋಟ್ II ನೇ ಶ್ರೇಣಿಯನ್ನು ವಿಚಿತ್ರ ಶೈಲಿಯಲ್ಲಿ ಇರಿಸಲಾಗಿದೆ, ನೀವು ವಿಂಡೋದ ಕೆಳಭಾಗದಲ್ಲಿ ಭಾಷೆ ಹೊಂದಿಸಲು ಮತ್ತು ಸಂಪಾದನೆ ಬಟನ್ ಕೆಳಭಾಗದಲ್ಲಿದೆ, ಆದರೆ ರೆಕಾರ್ಡ್ ಬಟನ್ ಮೇಲಿನ ಬಲ ಸ್ಥಾನದಲ್ಲಿದೆ.

ನೀವು ಮಾಡಬೇಕಾದ ಮೊದಲನೆಯದು ಒಂದು ಭಾಷೆಯನ್ನು ಆಯ್ಕೆ ಮಾಡಿಕೊಳ್ಳುತ್ತದೆ ಮತ್ತು ಇದನ್ನು ವಿಶ್ವ ಐಕಾನ್ ಕ್ಲಿಕ್ ಮಾಡುವುದರ ಮೂಲಕ ಸಾಧಿಸಬಹುದು.

ರೆಕಾರ್ಡಿಂಗ್ ಪ್ರಾರಂಭಿಸಲು, ಮೈಕ್ರೊಫೋನ್ ಐಕಾನ್ ಕ್ಲಿಕ್ ಮಾಡಿ ಮತ್ತು ನಿಮ್ಮ ಮೈಕ್ರೊಫೋನ್ಗೆ ಮಾತನಾಡಲು ಪ್ರಾರಂಭಿಸಿ. ಸಾಫ್ಟ್ವೇರ್ ನಿಧಾನವಾಗಿ ಮಾತನಾಡುವಂತೆ ಕಂಡುಬಂದ ಅತ್ಯುತ್ತಮ ಫಲಿತಾಂಶಗಳೆಂದರೆ, ತಂತ್ರಾಂಶವು ಮುಂದುವರೆಯಲು ಅವಕಾಶವಿರುತ್ತದೆ.

ಕೆಳಗಿನವುಗಳನ್ನು ನೋಡಬಹುದು ಎಂದು ಫಲಿತಾಂಶಗಳು ಉತ್ತಮವಾಗಿರಲಿಲ್ಲ:

ಹಲೋ ಮತ್ತು ಸಂಪರ್ಕಿಸಲು ಸ್ವಾಗತ. ಪರಿವರ್ತನೆಗಳು ಎಂದು ಪಠ್ಯ ಪರಿವರ್ತನೆ dunelm farrell ಹಿಂಜರಿತ 2008 ಗೆ ಧ್ವನಿ ಬಗ್ಗೆ ಇಂದಿನ ಲೇಖನಗಳು ಮತ್ತು ನಾನು ನೀವು ಆಯ್ಕೆ ಬಯಸಿದರೆ ನಾನು ಅದನ್ನು ತೆರೆಯಲು ಪಠ್ಯಕ್ಕೆ ಧ್ವನಿ ರೀತಿಯ ತೆರೆಯಲು 2014debian ಅಥವಾ rpm ಪ್ಯಾಕೇಜ್ ತೋರಿಸಲು ಧ್ವನಿ ಪಠ್ಯ addon ಕಂಡುಬಂದಿಲ್ಲ ಉತ್ತಮ ರೀತಿಯಲ್ಲಿ ಬೆಂಬಲ ಹೇಳಿದರು ಎಡಿನ್ಬರ್ಗ್ ಫ್ರೆಂಚ್ ಜರ್ಮನ್ನಲ್ಲಿ ಆಯ್ಕೆ ಮಾಡಿಕೊಂಡರು ಸಮುದ್ರದ ಮೈಕ್ರೊಫೋನ್ನಲ್ಲಿ ನೀವು ಯುನೈಟೆಡ್ ಕಿಂಗ್ಡಮ್ನಲ್ಲಿರುವ ಸಮಯವನ್ನು ಪಡೆದುಕೊಳ್ಳುತ್ತೀರಿ ನೀವು ಪಠ್ಯವನ್ನು ಕಡತಕ್ಕೆ ಅದರ ಪಠ್ಯವನ್ನು ಬರೆದು ಮುಗಿಸಿದ ನಂತರ ಅದು ಉತ್ತಮ ಇಂಗ್ಲಿಷ್ ದಕ್ಷಿಣದ ಅತ್ಯಂತ ಗುಣಮಟ್ಟದ ಇಂಗ್ಲಿಷ್ ಉಚ್ಚಾರಣೆಯಾಗಿದೆ ಆದರೆ ಅದು ನಾನು ಈ ಟೊರೆಂಟ್ಟಾಂಗ್ ನಿಜವಾದ ದಸ್ತಾವೇಜು ಮತ್ತು ನೀವು ಕೇಳುವ ಗೆಳೆಯರಿಗೆ ನೀವು ಮಾಡುವ ತಪ್ಪುಗಳನ್ನು ನೋಡಬಹುದು

ಡಿಕ್ಟಾನೋಟ್

ಡಿಕ್ಟಾನೋಟ್ ಎಂಬುದು ಮತ್ತೊಂದು Chrome ಅಪ್ಲಿಕೇಶನ್ ಆಗಿದೆ, ಅದನ್ನು ಡಿಕ್ಟೇಷನ್ ಉದ್ದೇಶಗಳಿಗಾಗಿ ಬಳಸಬಹುದಾಗಿರುತ್ತದೆ ಮತ್ತು ಹೆಚ್ಚು ಅರ್ಥಗರ್ಭಿತವಾಗಿ ಕಂಡುಬರುತ್ತದೆ ಆದರೆ ಫಲಿತಾಂಶಗಳು ವಾಯ್ಸ್ನೋಟ್ II ಗಿಂತ ಉತ್ತಮವಾಗಿರಲಿಲ್ಲ.

ನಾನು ಹೊಸ ಡಾಕ್ಯುಮೆಂಟ್ಗಳನ್ನು ರಚಿಸಲು ನಿಮ್ಮನ್ನು ತಡೆಯುವ ಡಿಕ್ಟಾನೋಟ್ನ ಡೆಮೊ ಆವೃತ್ತಿಯನ್ನು ಮಾತ್ರ ಬಳಸಿದ್ದೇನೆ ಆದರೆ ಸಂಪಾದಕದಲ್ಲಿ ಈಗಾಗಲೇ ಇರುವ ಪಠ್ಯವನ್ನು ಮಾತನಾಡಲು ಇದು ನಿಮಗೆ ಅವಕಾಶ ನೀಡುತ್ತದೆ. ನಾನು ಧ್ವನಿ ಗುರುತಿಸುವಿಕೆಯನ್ನು ಪರೀಕ್ಷಿಸಲು ಸಾಧ್ಯವಾಯಿತು ಆದರೆ ಫಲಿತಾಂಶಗಳು ವಾಯ್ಸ್ ನೋಟ್ II ಗಿಂತ ಉತ್ತಮವಾಗಿರಲಿಲ್ಲ ಮತ್ತು ಆದ್ದರಿಂದ ನಾನು ಪ್ರೊ ಆವೃತ್ತಿಗೆ ಸೈನ್ ಅಪ್ ಮಾಡಲಿಲ್ಲ.

ಡಿಕ್ಟೇಷನ್ ಮತ್ತು ಮೇಲ್

"ಡಿಕ್ಟೇಷನ್ ಅಂಡ್ ಮೇಲ್" ಎನ್ನುವುದು ಸ್ಥಳೀಯ ಗೂಗಲ್ ಧ್ವನಿ ಗುರುತಿಸುವಿಕೆ API ಅನ್ನು ಬಳಸುವ ಒಂದು Android ಅಪ್ಲಿಕೇಶನ್ ಆಗಿದೆ.

"ಡಿಕ್ಟೇಷನ್ ಮತ್ತು ಮೇಲ್" ಯ ಫಲಿತಾಂಶಗಳು ಈ ಹಂತದವರೆಗೂ ಪ್ರಯತ್ನಿಸಿದ ಯಾವುದೇ ಕಾರ್ಯಕ್ರಮಕ್ಕಿಂತ ಉತ್ತಮವಾಗಿವೆ.

ಹಲೋ ಲಿನಕ್ಸ್ಗೆ ಸ್ವಾಗತ., ಇಂದು ನಾವು ಧ್ವನಿಯನ್ನು ಪಠ್ಯಕ್ಕೆ ಪರಿವರ್ತಿಸುವ ಬಗ್ಗೆ ಮಾತನಾಡುತ್ತೇವೆ

"ಡಿಕ್ಟೇಷನ್ ಮತ್ತು ಮೇಲ್" ಯೊಂದಿಗೆ ಟ್ರಿಕ್ ನಿಧಾನವಾಗಿ ಮತ್ತು ಉಚ್ಚಾರಣೆ ಮಾಡುವ ಮೂಲಕ ಮತ್ತು ನೀವು ಇನ್ನೂ ಉಚ್ಚಾರಣೆಯೊಂದಿಗೆ ಮಾತನಾಡಬೇಕು.

ನೀವು ಮಾತುಕತೆ ಮುಗಿಸಿದ ನಂತರ ಫಲಿತಾಂಶಗಳನ್ನು ನಿಮಗೆ ಇಮೇಲ್ ಮಾಡಬಹುದು.

ಚರ್ಚೆ ಮತ್ತು ಚರ್ಚೆ ಡಿಕ್ಟೇಷನ್

ನಾನು ಪ್ರಯತ್ನಿಸಿದ ಇತರ ಆಂಡ್ರಾಯ್ಡ್ ಅಪ್ಲಿಕೇಶನ್ "ಟಾಕ್ ಆಂಡ್ ಟಾಕ್ ಡಿಕ್ಟೇಷನ್".

ಈ ಅಪ್ಲಿಕೇಶನ್ಗಾಗಿ ಇಂಟರ್ಫೇಸ್ ಗುಂಪಿನ ಉತ್ತಮ ಮತ್ತು ಧ್ವನಿ ಗುರುತಿಸುವಿಕೆ ತುಂಬಾ ಚೆನ್ನಾಗಿ ಕೆಲಸ. ಡಿಕ್ಟೇಷನ್ ರೆಕಾರ್ಡಿಂಗ್ ನಂತರ ನಾನು ಇಮೇಲ್ ಮೂಲಕ ಸೇರಿದಂತೆ ವಿವಿಧ ರೀತಿಯಲ್ಲಿ ಫಲಿತಾಂಶಗಳನ್ನು ಹಂಚಿಕೊಳ್ಳಲು ಸಾಧ್ಯವಾಯಿತು.

ಇಂದು linux about.com ಗೆ ಸ್ವಾಗತ ನಾವು ಪಠ್ಯವನ್ನು ಪಠ್ಯಕ್ಕೆ ಪರಿವರ್ತಿಸುವ ಬಗ್ಗೆ ಮಾತನಾಡುತ್ತೇವೆ

ನೀವು ಮೇಲಿನ ಪಠ್ಯವನ್ನು ನೋಡಬಹುದು ಎಂದು ನೀವು ಬಹುಶಃ ನಿರೀಕ್ಷಿಸಬಹುದು ಎಂದು ಸ್ಪಷ್ಟವಾಗಿದೆ. ನಿಧಾನವಾಗಿ ಮಾತನಾಡುವುದು ಮುಖ್ಯವಾಗಿದೆ.

ಸಾರಾಂಶ

ಸ್ಥಳೀಯ ಲಿನಕ್ಸ್ ಧ್ವನಿ ಗುರುತಿಸುವಿಕೆ ಮತ್ತು ನಿರ್ದಿಷ್ಟವಾಗಿ ಹೇಳಿಕೆಗೆ ಸಂಬಂಧಿಸಿದಂತೆ ಹೋಗಲು ಕೆಲವು ಮಾರ್ಗವನ್ನು ಹೊಂದಿದೆ. Google Voice API ಬಳಸುವ ಕೆಲವು ಅಪ್ಲಿಕೇಶನ್ಗಳು ಇವೆ, ಆದರೆ ಅವು ಇನ್ನೂ ರೆಪೊಸಿಟರಿಗಳಲ್ಲಿ ಪಟ್ಟಿ ಮಾಡಲಾಗಿಲ್ಲ.

ChromeOS ಅಪ್ಲಿಕೇಶನ್ಗಳು ಸ್ವಲ್ಪ ಉತ್ತಮವಾಗಿದೆ ಆದರೆ ನನ್ನ ಆಂಡ್ರಾಯ್ಡ್ ಫೋನ್ ಬಳಸಿ ಉತ್ತಮ ಫಲಿತಾಂಶಗಳನ್ನು ಸಾಧಿಸಲಾಗಿದೆ. ಬಹುಶಃ ಫೋನ್ ಉತ್ತಮ ಮೈಕ್ರೊಫೋನ್ ಹೊಂದಿದೆ ಮತ್ತು ಆದ್ದರಿಂದ ಧ್ವನಿ ಗುರುತಿಸುವಿಕೆ ಸಾಫ್ಟ್ವೇರ್ ಪರಿವರ್ತನೆಯ ಉತ್ತಮ ಅವಕಾಶವನ್ನು ಹೊಂದಿದೆ.

ಧ್ವನಿ ಗುರುತಿಸುವಿಕೆಗೆ ನಿಜವಾಗಿಯೂ ಬಳಕೆಯಾಗಲು ಇದು ಕಡಿಮೆ ಸೆಟಪ್ ಅಗತ್ಯವಿರುವ ಹೆಚ್ಚು ಅರ್ಥಗರ್ಭಿತತೆಯ ಅಗತ್ಯವಿದೆ. ಅದನ್ನು ಅರ್ಥವಾಗುವಂತೆ ಮಾಡಲು ನೀವು ಭಾಷಾ ಮಾದರಿಗಳು ಮತ್ತು ನಿಘಂಟಿನೊಂದಿಗೆ ಅವ್ಯವಸ್ಥೆ ಮಾಡಬೇಕಾಗಿಲ್ಲ.

ಆದರೆ ಧ್ವನಿ ಗುರುತಿಸುವಿಕೆ ಇಡೀ ಕಲೆಯು ತುಂಬಾ ಸವಾಲಿನದಾಗಿದೆ ಎಂದು ನಾನು ಮೆಚ್ಚುತ್ತಿದ್ದೇನೆ ಏಕೆಂದರೆ ಪ್ರತಿಯೊಬ್ಬರಿಗೂ ವಿಭಿನ್ನ ಧ್ವನಿಯನ್ನು ಹೊಂದಿದೆ ಮತ್ತು ಜಗತ್ತಿನಾದ್ಯಂತ ಬಳಸಲಾಗುವ ನೂರಾರು ಭಾಷೆಗಳ ಬಗ್ಗೆ ಚಿಂತೆ ಮಾಡುವ ಒಂದು ಪ್ರದೇಶದ ಪ್ರದೇಶದಿಂದ ಪ್ರದೇಶಕ್ಕೆ ಹಲವಾರು ಭಾಷೆಗಳು ಇವೆ.

ಆದ್ದರಿಂದ ನನ್ನ ವಿಶ್ಲೇಷಣೆ, ಧ್ವನಿ ಗುರುತಿಸುವಿಕೆ ಸಾಫ್ಟ್ವೇರ್ ಇನ್ನೂ ಪ್ರಗತಿಯಲ್ಲಿದೆ ಎಂಬುದು.