其实吧也没那么难,1000把琴应该就够了
– 网站管理员
1. 数据库的定义
简单来说,这个数据库是提琴声学数据库。采集与一把提琴声学性能有关的各项数据。例如:年代,琴型,重量,频谱数据与声辐射数据。数据格式包括图片,文字,录音等。
2. 现有数据库:
迄今为止,世界上已经有很多提琴声学研究者都曾经建立了自己的提琴声学数据库,对多达几百把提琴进行了声学测量。如果已经存在的数据库已经足够完备,那么这个网站没有存在的必要。虽然有了前辈的学术积累,但大量的理论与工作仍等着被人验证与运用。
- 哈金斯夫人测量了几百把涵盖了各个历史时期的提琴。
- Martin Schleske又测量了几百把;
- Jack Fry拆且拆废掉了一百把;
- Savart又拆又测量了十几把,有同学觉得就这?就这?那十几把全都是黄金时期的Stradivari和Guaneri。
- Joseph Curtin 2009年的时候已经测量了30几把,到2020年他已经积累了超过100把样本而且主要是老琴。
上述这些前辈的身份之一都是制琴师。而学者们测量的明显没有这么多例如: Bissinger测量了20把左右;Cludia测量了16把;Stoppani测量了几十把。他们在各自的年代使用各自的测量方案得出了各种结果。但这样的数据测量存在如下问题:
- 测量方案的方法不一致导致他们之间的数据不存在交互性,无法集中进行分析。同一种测量方案中的校准与操作规范,实验环境并不统一。
- 迄今为止使用的全部硬件与部分软件全都是厂商级或工业级的仪器,并没有专门研发出针对测量提琴用的仪器。我们经常可以看到仅适用麦克风作为传感器而没有进行信号预处理的情况发生。
- 测量提琴样本的范围需要进一步讨论。虽然我们已经测量了很多名古琴,和现代顶级制琴师作品。但从数据分析的角度来看,也许并不好听的工厂琴,学生琴也需要足够的样本量。甚至其他改进型提琴。
- 仅有客观测量的数据并不能如实反映一把提琴的声学性能,数据库需要同时包括主观与客观两种维度的数据进行足够样本量的比对才有意义。
- 大量的数据被用于研究音色,而涉及到音质的各项参数(例如音量,均衡性与动态演奏范围等)并没有成为重要的数据分析维度。
如果没有一个由非制琴师建立的,满足统计学需求的数据库我们可能永远不知道真相是什么。另一方面,如果仅是跟在国际上其他学者之后想要无代价的享受提琴声学在提琴制作上的成果也不太现实。前辈与老师们已经分享了足够多的知识需要思考与实践,坐享其成很难拿到一个万能公式做出好琴。
3. 理想的数据库
如果使用科研的标准去看待过去的测量系统的话,厂商的东西都不太行。当你把别人家的测量方案资料整理提交到老师那里去的时候,请做好面对疾风的心理准备:别管什么大厂和小厂,也不论是民用级还是工业级。到了导师那里可能需要把他们老板一个个拉过来审一遍。我们过去读说明书和各种看上去高大上的实验室检测结果到这里都不太适用。例如,仪器的校准一定要做到朔源级,单位要还原成千克/立方米自己做一遍。质检报告一律无视,甭管你是瑞士还是德国实验室里给开的,自己实验室里做不出来就是白扯。软件破解的不许用,开源免费的窗口设置不对,频段看起来费劲。什么?传感器和声卡你用介个牌子?玩乐队用的音频器材用在实验上论文基本别想过了。还有内什么,买个破锤子你要花两万?你就是个锤子。
在备受打击之下,网管终于搞明白了数据库与测量系统的终极奥义:全都要自己做
- 测量系统的整体研发思路中要实现软件与硬件有机结合,将工业级的可靠性与精度作为标准。不能依赖于民用级音响器材。设计上要优先考虑充分调用计算机底层资源。整体系统需要具备升级和二次开发的能力成为未来长期的工作提供保障。
- 测量系统的构成至少要包括:激励装置,预处理型ADC,数据存储与调用功能。都需要具备兼容性既能支持原有实验中的方案也可以有更多可优化的方案。
- 测量系统整不数据库之间的接口功能,采集的数据类型包括提琴基本文本描述,图片,规频,声辐射数据并使用统一的系统界面迚行数据录入。在存储的数据文件中建立索引字段,为每一个提琴样本提供完整的资料库信息调用不管理。对样本迚行对比分析时可以选择不同的数据维度迚行交叉对比分析。
- 数据采集的操作人员需要经过培训,每一个操作细节都可能影响测量结果。传感器和电子设备并不完美。加速器沿电缆有质量损耗、物理损耗和电气损耗。选择的驱劢点和悬架系统也会导致测量结果的差异。
- 测量环境的选择中需要考虑到易亍操作性。虽然最理想的是全消录音室,但这也只是低混响室。
- 采样分类范围要涵盖各类型等级。不光需要测试古董名琴,也需要现代手工提琴和声学性能较低的工厂琴。样本采集量需要符合统计学要求。
- 数据统计设计中需要考虑到心理声学设计。重点加强对亍演奏考主观判断系统的设计。参与主观评测的人员需要通过科学的听力测试做筛选。
- 当样本量足够时,使用自行开发的机器学习算法进行数据挖掘,寻找提琴各声学数据中可能存在的相关性。
- 永久性保留中立性。包括并不限于所有现代提琴声学样本全部做匿名处理;数据库保持开源状态,对所有访问者开放。
4. 所需资源
想要建立理想中的数据,需要比较多的资源。在这些资源中,除了非常重要的项目经费,还有更重要的是需要各个领域具备专业知识与经验的老师与同学们的加入。这很不容易,并且也并没有个人或单独的某个团体可以解决。目前世界上的提琴研究中,如何寻找项目经费成为了各国提琴声学研究者主要面临的难题。依靠个别制琴师的个人收入,即使是世界顶级的制琴师也难以承受长期的巨量的经费投入。在国际上的提琴声学研究中,至今没有基金会与高校将这一课题正式立项进行长期的有建制的研究。目前国际上的提琴声学经费的筹集中少量有限经费来自于欧盟的木质乐器保护基金和一些大学的资助。此外,涉及到各个学科的专业知识的积累需要耗费一个人大量的时间与精力。虽然我们看到在提琴声学研究者中有例如George Stoppani先生这样的多面手,可以今天为大家讲解模态分析,明天自行研发测量软件;既可以介绍琴漆化学还能实践羊肠弦制作传统技能。但在面对与提琴相关的更多学科中,仍需要大量的专业人士的加入才可以取得有效率的进展。如下团队配置可以基本满足建立提琴数据库的需求:
通讯电信号处理背景的软件工程师
林业学与材料学背景的伐木工人
机械工程背景的测量专家
乐器考古背景的职业演奏家
买得起提琴博物馆的项目经理
物理学家