跳转至

语言科学

《语言科学》由袁家宏教授讲授,主要覆盖语音学,音系学,句法学(未完待续)等方向的语言科学的知识,是一门导论性质的通识课程,下面是我对这门课程的笔记。

IPA 和语音转写

语音转写的历史

IPA

语音转写

  • 语音转写 Phonetic transcrption—用 [] 表示,以音素 Phone 为单位;
  • 音位转写 Phonemic transcription—用 // 表示,以音位 Phoneme 为单位;
  • ToBI (Tone and Break Index) 是一个语调转写系统
  • 汉语声调会使用改进的 ToBI 系统(如 C-ToBI, Pan-Mandarin ToBI,等)

语音学

语音学的历史

  • 口耳语音学(Aṣṭādhyāyī of Pāṇini)
  • 实验语音学:发音语音学 Articulatory Phonetics、声学语音学 Acoustic Phonetics、听觉语音学 Auditory Phonetics

声学语音学

  • 声源-滤波模型
  • 元音—基频,共振峰,音高
  • 辅音—湍流 turbulence,冲击波 shock wave

    • 塞音—共振峰过渡,核心区 Locus(类比元音共振峰)
    • [k] 软腭捏 velar pinch
  • https://markhuckvale.com/vowels/

  • https://home.cc.umanitoba.ca/~robh/howto.html

声源-滤波模型

下面只介绍由若干个圆筒拼接而成的系统:

我们假设筒内只有沿圆筒轴向传播的平面波(所有波都沿轴向传播,这是以下我们证明的前提)

声音的传播

首先我们要推导用来描述声波的方程,回忆热学中学到的绝热过程 (adiabatic process),绝热过程中,我们有:

\[ p=K\rho^\gamma \]

其中 \(\gamma\) 是比热容比,对于理想气体,\(\gamma\) 是取决于分子自由度的常数(这点应该要回忆起来)。在线性声学的前提下,我们认为:

\[ p = p_0 + p^\prime,\quad \rho = \rho_0 + \rho^\prime \]

将这个小扰动假定带入方程,我们可以得到:

\[ \begin{gather} p = K\rho^\gamma \\ p_0+p^\prime=K(\rho_0+\rho^\prime)^\gamma \\ \implies p_0+p^\prime = K\rho_0^\gamma + K \gamma \rho_0^{\gamma-1}\rho^\prime + o(\rho^\prime) \\ \text{带入静息状态下的}~p_0=K\rho_0^\gamma\text:\\ \implies p^\prime\approx K\gamma\rho_0^{\gamma-1}\rho^\prime=\gamma\frac{p_0}{\rho_0}\rho^\prime \end{gather} \]

根据绝热声速 (adiabatic sound speed) 的定义 \(c^2 = \left(\frac{\partial p}{\partial \rho}\right)_s\),我们可以得到:

\[ p^\prime = c^2\rho^\prime \]

直观上理解,这个方程的含义是——压强的微小改变与密度的微小改变成正比,将该式子带入空气的连续性方程和动量守恒方程,可以得到一维波方程:

\[ \begin{gather} \frac{\partial \rho^\prime}{\partial t} + \rho_0\frac{\partial u}{\partial x} = 0,\quad \rho_0\frac{\partial u}{\partial t} = -\frac{\partial p^\prime}{\partial x}\\ \implies \frac{\partial^2 p'}{\partial x^2} = \frac{1}{c^2}\frac{\partial^2 p'}{\partial t^2} \end{gather} \]

系统的分析

使用线性时不变系统的方式分析这个系统,在频域上对每个频率分别分析:

\[ \begin{gather} p'(x,t) = \Re\{P(x)e^{j\omega t}\}, \quad u(x,t) = \Re\{U(x)e^{j\omega t}\} \\ \implies \tilde p(x,t)= P(x)e^{j\omega t} \\ \implies \frac{\partial \tilde p}{\partial x} = P^\prime(x)e^{j\omega t},\quad \frac{\partial^2 \tilde p}{\partial x^2} = P^{\prime\prime}(x)e^{j\omega t}\\ \frac{\partial \tilde p}{\partial t} = j\omega P(x)e^{j\omega t},\quad \frac{\partial^2 \tilde p}{\partial t^2}=-\omega^2P(x)e^{j\omega t} \end{gather} \]

带入刚才的一维波方程可以得到:

\[ \begin{gather} P^{\prime\prime}(x)e^{j\omega t}=\frac{1}{c^2}(-\omega^2P(x)e^{j\omega t}) \\ \implies \frac{\mathrm d^2 P}{\mathrm dx^2}+k^2P =0,\quad\text{where}~k=\frac{\omega}{c} \end{gather} \]

有通解:

\[ P(x)=P^+ e^{-jkx}+P^-e^{jkx} \]

单根管

  • 长度为 \(L\) 的管,头位于 \(x=0\) 处,尾位于 \(x=L\) 处:
\[ \begin{gather} p_{\text{in}} = P(0)=P^+ + P^-, \\ \mathcal U_{\text{in}} = \mathcal U(0)=\frac{1}{Z_c}(P^+ - P^-). \\ p_{\text{out}} = P(L)=P^+e^{-jkL}+P^-e^{jkL}, \\ \mathcal U_{\text{out}}=\frac{1}{Z_c}(P^+e^{-jkL}-P^-e^{jkL}). \end{gather} \]

其中 \(\mathcal U_\text{in}\)\(\mathcal U_\text{out}\) 都表示流速(体速度),\(Z_c\) 是声波阻抗,定义为 \(\frac{\rho c}{A}\),解这四个方程我们可以得到:

\[ \begin{gather} \begin{bmatrix} p_\text{out} \\ U_\text{out} \end{bmatrix} = \begin{bmatrix} \cos(kL) & -jZ_c\sin(kL) \\ -\dfrac{j\sin(kL)}{Z_c} & \cos(kL) \end{bmatrix} \begin{bmatrix} p_\text{in}\\ U_\text{in} \end{bmatrix} \\ \begin{bmatrix} p_\text{in} \\ U_\text{in} \end{bmatrix} = \begin{bmatrix} \cos(kL) & jZ_c\sin(kL) \\ \dfrac{j\sin(kL)}{Z_c} & \cos(kL) \end{bmatrix} \begin{bmatrix} p_\text{out}\\ U_\text{out} \end{bmatrix} \end{gather} \]

多圆管系统

\[ \begin{gather} \mathbf{T}_i(\omega)= \begin{bmatrix} \cos(kL_i) & j Z_{c,i} \sin(kL_i) \\ j \dfrac{\sin(kL_i)}{Z_{c,i}} & \cos(kL_i) \end{bmatrix} \\ \mathbf{T}_{\mathrm{total}}(\omega) = \mathbf{T}_1(\omega)\mathbf{T}_2(\omega)\cdots\mathbf{T}_N(\omega) = \begin{bmatrix} A(\omega) & B(\omega) \\ C(\omega) & D(\omega) \end{bmatrix} \end{gather} \]

一旦我们得到了整个系统的转移矩阵,我们就可以带入边值条件得到响应曲线。在开放端,我们有发射阻抗 (radiation impedance):

\[ p_{\mathrm{out}} = Z_{\mathrm{rad}}(\omega) U_{\mathrm{out}} \]

将该关系带入:

\[ \begin{bmatrix} p_{\mathrm{in}} \\ U_{\mathrm{in}} \end{bmatrix} = \begin{bmatrix} A & B \\ C & D \end{bmatrix} \begin{bmatrix} p_{\mathrm{out}} \\ U_{\mathrm{out}} \end{bmatrix} \]

我们可以得到:

\[ H(\omega) = \frac{U_{\mathrm{out}}}{U_{\mathrm{in}}} = \frac{1}{C(\omega)Z_{\mathrm{rad}}(\omega) + D(\omega)} \]

在管道开放的情况下,\(Z_{rad}(\omega)=0\),此时 \(H(\omega) \approx \frac{1}{D(\omega)}\)\(D(\omega)\approx0\) 处的点就是元音的共振峰。

音系学

  • 音系学 Phonology—研究语言中的语音结构
  • 汉语的音系学和音韵学
  • 音素 phone 与音位 phoneme 之对立;音韵分析 phonetic analysis
  • 音位变体 allophone
  • 音系规则 phonological rules;音系规则有一定的表示形式
    • 自然类 natural class:音系规则中常见的类别,鼻音 nasals 阻塞音 obstruents 唇音 labials 咝音 sibilants
  • 区别特征 distinctive features:布拉格学派

音位分析的原则: 1. 对立原则——对立 contrastive 的音素必须归纳为不同的音位 - 互补 complimentary 的两个音素可以归纳为同一个音位(如 spin/pin) 2. 互补原则 3. 相似性原则和系统性原则(比如汉语中的 j/q/x zh/chi/shi) 4. 蕴含原则 implicational law

  • 语流音变:同化 assimilation 插入 insertion 删除 deletion 加强 strengthening 减弱 weakening 位置交换 metathesis
  • 语流音变和语言演化的关系
  • 优选论 optimality theory——相比于 Rule-based phonology

https://wals.info

汉语的四呼

四呼是汉语音韵学中的概念

  • 汉语的结构分为声母+韵母(介音(开合、等),韵腹,韵尾)+声调;
  • 韵腹和韵尾统称韵,韵和声调统称声调
  • 开口呼,齐齿呼,合口呼和撮口呼

自动语音分析

自动 IPA 转写、自动音位分析、自动声调转写、自动调类分析对于现阶段机器学习是一个较为困难的任务

发音音系学

在发音音系学 articulatory phonology 中,语音的基本单位是音势 gestures,而非音素;

评论