万象素材 › 万象专栏 › 人工智能专栏

你真的懂语音特征吗？【图文】

推荐

萌态尤物 2021-08-09 11:27 2021/08/09 ©著作权读给你听

文章标签 语音声学时域图音频时域其他人工智能万象人工智能专栏 专栏分类人工智能 阅读数12862 评论数0 点赞数4 收藏数0

导读：摘要：本文旨在详细介绍语音转化声学特征的过程，并详细介绍不同声学特征在不同模型中的应用。本文分享自华为云社区..

摘要：本文旨在详细介绍语音转化声学特征的过程，并详细介绍不同声学特征在不同模型中的应用。

语音数据常被用于人工智能任务，但语音数据往往不能像图像任务那样直接输入到模型中训练，其在长时域上没有明显的特征变化，很难学习到语音数据的特征，加之语音的时域数据通常由16K采样率构成，即1秒16000个采样点，直接输入时域采样点训练数据量大且很难有训练出实际效果。因此语音任务通常是将语音数据转化为声学特征作为模型的输入或者输出。因此本文指在详细介绍语音转化声学特征的过程，并详细介绍不同声学特征在不同模型中的应用。

首先搞清语音是怎么产生的对于我们理解语音有很大帮助。人通过声道产生声音，声道的形状决定了发出怎样的声音。声道的形状包括舌头，牙齿等。如果可以准确的知道这个形状，那么我们就可以对产生的音素进行准确的描述。声道的形状通常由语音短时功率谱的包络中显示出来。那如何得到功率谱，或者在功率谱的基础上得到频谱包络，便是可以或得语音的特征。

一、时域图

更多文章请关注《万象专栏》

转载请注明出处：https://www.wanxiangsucai.com/read/cv14984

话题推荐： #语音# #声学# #时域图# #音频# #时域# #其他# #人工智能# #万象人工智能专栏#

打赏
4 赞
收藏
评论
举报

下一篇：四个月内掌握AI快速入门人工智能的关键技能与学习路径

发布评论

全部评论(0)

你真的懂语音特征吗？【图文】

你真的懂语音特征吗？【图文】

一、时域图

相关文章

dhcp

#yyds干货盘点# 织梦微信分享开发【图文】

为什么学完Web前端后薪资如此之高？原因如下【图文】

fabric区块解析【附源码】

MT61K256M32JE-19G:T/D8BWW显卡芯片【图文】

财务机器人，财会人的毒药还是解药？【图文】

windows系统下安装和使用ROS的解决方案 2019年4月更新(1﻿﻿﻿﻿ win

Web前端培训分享：前端开源平台介绍【图文】

MT61K512M32KPA-16:C显卡D9ZPP芯片GDDR6X【图文】

#yyds干货盘点#利用Matplotlib库画图（六）【图文】

windows系统下安装和使用ROS的解决方案 2019年4月更新(1 win