语言科学
《语言科学》由袁家宏教授讲授,主要覆盖语音学,音系学,句法学(未完待续)等方向的语言科学的知识,是一门导论性质的通识课程,下面是我对这门课程的笔记。
IPA 和语音转写
语音转写的历史
IPA
语音转写
- 语音转写 Phonetic transcrption—用
[] 表示,以音素 Phone 为单位;
- 音位转写 Phonemic transcription—用
// 表示,以音位 Phoneme 为单位;
- ToBI (Tone and Break Index) 是一个语调转写系统
- 汉语声调会使用改进的 ToBI 系统(如 C-ToBI, Pan-Mandarin ToBI,等)
语音学
语音学的历史
- 口耳语音学(Aṣṭādhyāyī of Pāṇini)
- 实验语音学:发音语音学 Articulatory Phonetics、声学语音学 Acoustic Phonetics、听觉语音学 Auditory Phonetics
声学语音学
声源-滤波模型
下面只介绍由若干个圆筒拼接而成的系统:

我们假设筒内只有沿圆筒轴向传播的平面波(所有波都沿轴向传播,这是以下我们证明的前提)
声音的传播
首先我们要推导用来描述声波的方程,回忆热学中学到的绝热过程 (adiabatic process),绝热过程中,我们有:
\[
p=K\rho^\gamma
\]
其中 \(\gamma\) 是比热容比,对于理想气体,\(\gamma\) 是取决于分子自由度的常数(这点应该要回忆起来)。在线性声学的前提下,我们认为:
\[
p = p_0 + p^\prime,\quad \rho = \rho_0 + \rho^\prime
\]
将这个小扰动假定带入方程,我们可以得到:
\[
\begin{gather}
p = K\rho^\gamma \\
p_0+p^\prime=K(\rho_0+\rho^\prime)^\gamma \\
\implies p_0+p^\prime = K\rho_0^\gamma + K \gamma \rho_0^{\gamma-1}\rho^\prime + o(\rho^\prime) \\
\text{带入静息状态下的}~p_0=K\rho_0^\gamma\text:\\
\implies p^\prime\approx K\gamma\rho_0^{\gamma-1}\rho^\prime=\gamma\frac{p_0}{\rho_0}\rho^\prime
\end{gather}
\]
根据绝热声速 (adiabatic sound speed) 的定义 \(c^2 = \left(\frac{\partial p}{\partial \rho}\right)_s\),我们可以得到:
\[
p^\prime = c^2\rho^\prime
\]
直观上理解,这个方程的含义是——压强的微小改变与密度的微小改变成正比,将该式子带入空气的连续性方程和动量守恒方程,可以得到一维波方程:
\[
\begin{gather}
\frac{\partial \rho^\prime}{\partial t} + \rho_0\frac{\partial u}{\partial x} = 0,\quad \rho_0\frac{\partial u}{\partial t} = -\frac{\partial p^\prime}{\partial x}\\
\implies \frac{\partial^2 p'}{\partial x^2} = \frac{1}{c^2}\frac{\partial^2 p'}{\partial t^2}
\end{gather}
\]
系统的分析
使用线性时不变系统的方式分析这个系统,在频域上对每个频率分别分析:
\[
\begin{gather}
p'(x,t) = \Re\{P(x)e^{j\omega t}\}, \quad
u(x,t) = \Re\{U(x)e^{j\omega t}\} \\
\implies \tilde p(x,t)= P(x)e^{j\omega t} \\
\implies \frac{\partial \tilde p}{\partial x} = P^\prime(x)e^{j\omega t},\quad \frac{\partial^2 \tilde p}{\partial x^2} = P^{\prime\prime}(x)e^{j\omega t}\\
\frac{\partial \tilde p}{\partial t} = j\omega P(x)e^{j\omega t},\quad \frac{\partial^2 \tilde p}{\partial t^2}=-\omega^2P(x)e^{j\omega t}
\end{gather}
\]
带入刚才的一维波方程可以得到:
\[
\begin{gather}
P^{\prime\prime}(x)e^{j\omega t}=\frac{1}{c^2}(-\omega^2P(x)e^{j\omega t}) \\
\implies \frac{\mathrm d^2 P}{\mathrm dx^2}+k^2P =0,\quad\text{where}~k=\frac{\omega}{c}
\end{gather}
\]
有通解:
\[
P(x)=P^+ e^{-jkx}+P^-e^{jkx}
\]
单根管
- 长度为 \(L\) 的管,头位于 \(x=0\) 处,尾位于 \(x=L\) 处:
\[
\begin{gather}
p_{\text{in}} = P(0)=P^+ + P^-, \\
\mathcal U_{\text{in}} = \mathcal U(0)=\frac{1}{Z_c}(P^+ - P^-). \\
p_{\text{out}} = P(L)=P^+e^{-jkL}+P^-e^{jkL}, \\
\mathcal U_{\text{out}}=\frac{1}{Z_c}(P^+e^{-jkL}-P^-e^{jkL}).
\end{gather}
\]
其中 \(\mathcal U_\text{in}\) 和 \(\mathcal U_\text{out}\) 都表示流速(体速度),\(Z_c\) 是声波阻抗,定义为 \(\frac{\rho c}{A}\),解这四个方程我们可以得到:
\[
\begin{gather}
\begin{bmatrix}
p_\text{out} \\
U_\text{out}
\end{bmatrix}
=
\begin{bmatrix}
\cos(kL) & -jZ_c\sin(kL) \\
-\dfrac{j\sin(kL)}{Z_c} & \cos(kL)
\end{bmatrix}
\begin{bmatrix}
p_\text{in}\\
U_\text{in}
\end{bmatrix} \\
\begin{bmatrix}
p_\text{in} \\
U_\text{in}
\end{bmatrix}
=
\begin{bmatrix}
\cos(kL) & jZ_c\sin(kL) \\
\dfrac{j\sin(kL)}{Z_c} & \cos(kL)
\end{bmatrix}
\begin{bmatrix}
p_\text{out}\\
U_\text{out}
\end{bmatrix}
\end{gather}
\]
多圆管系统
\[
\begin{gather}
\mathbf{T}_i(\omega)=
\begin{bmatrix}
\cos(kL_i) & j Z_{c,i} \sin(kL_i) \\
j \dfrac{\sin(kL_i)}{Z_{c,i}} & \cos(kL_i)
\end{bmatrix} \\
\mathbf{T}_{\mathrm{total}}(\omega)
=
\mathbf{T}_1(\omega)\mathbf{T}_2(\omega)\cdots\mathbf{T}_N(\omega)
=
\begin{bmatrix}
A(\omega) & B(\omega) \\
C(\omega) & D(\omega)
\end{bmatrix}
\end{gather}
\]
一旦我们得到了整个系统的转移矩阵,我们就可以带入边值条件得到响应曲线。在开放端,我们有发射阻抗 (radiation impedance):
\[
p_{\mathrm{out}} = Z_{\mathrm{rad}}(\omega) U_{\mathrm{out}}
\]
将该关系带入:
\[
\begin{bmatrix}
p_{\mathrm{in}} \\
U_{\mathrm{in}}
\end{bmatrix}
=
\begin{bmatrix}
A & B \\
C & D
\end{bmatrix}
\begin{bmatrix}
p_{\mathrm{out}} \\
U_{\mathrm{out}}
\end{bmatrix}
\]
我们可以得到:
\[
H(\omega)
=
\frac{U_{\mathrm{out}}}{U_{\mathrm{in}}}
=
\frac{1}{C(\omega)Z_{\mathrm{rad}}(\omega) + D(\omega)}
\]
在管道开放的情况下,\(Z_{rad}(\omega)=0\),此时 \(H(\omega) \approx \frac{1}{D(\omega)}\),\(D(\omega)\approx0\) 处的点就是元音的共振峰。
音系学
- 音系学 Phonology—研究语言中的语音结构
- 汉语的音系学和音韵学
- 音素 phone 与音位 phoneme 之对立;音韵分析 phonetic analysis
- 音位变体 allophone
- 音系规则 phonological rules;音系规则有一定的表示形式
- 自然类 natural class:音系规则中常见的类别,鼻音 nasals 阻塞音 obstruents 唇音 labials 咝音 sibilants
- 区别特征 distinctive features:布拉格学派
音位分析的原则:
1. 对立原则——对立 contrastive 的音素必须归纳为不同的音位
- 互补 complimentary 的两个音素可以归纳为同一个音位(如 spin/pin)
2. 互补原则
3. 相似性原则和系统性原则(比如汉语中的 j/q/x zh/chi/shi)
4. 蕴含原则 implicational law
- 语流音变:同化 assimilation 插入 insertion 删除 deletion 加强 strengthening 减弱 weakening 位置交换 metathesis
- 语流音变和语言演化的关系
- 优选论 optimality theory——相比于 Rule-based phonology
https://wals.info
汉语的四呼
四呼是汉语音韵学中的概念
- 汉语的结构分为声母+韵母(介音(开合、等),韵腹,韵尾)+声调;
- 韵腹和韵尾统称韵,韵和声调统称声调
- 开口呼,齐齿呼,合口呼和撮口呼
自动语音分析
自动 IPA 转写、自动音位分析、自动声调转写、自动调类分析对于现阶段机器学习是一个较为困难的任务
发音音系学
在发音音系学 articulatory phonology 中,语音的基本单位是音势 gestures,而非音素;