上海语言文化资源网络展示平台

  • 我国是世界上语言资源最丰富的国家之一,语言国情是国情的基本内容之一。为了全面了解我国的语言国情、促进我国语言文字信息化建设,国家语言文字工作委员会决定建设 “中国语言资源有声数据库”,利用现代科学技术,以县为单位实地采集全国各地语言和方言的有声数据,进行科学整理和加工,长期保存,以利于进一步深入研究 与有效开发利用。这是一项具有深远意义的国家语言文字重大工程。

    上海的建库工作自2011年3月启动,2014年12月完成。主要任务是调查采集上海行政区域内各区、县的方言和地方普通话的有声数据。建库工作由上海市语言文字工作委员会统筹领导,由复旦大学、华东师范大学、上海大学和上海师范大学等四所高校的专家团队具体实施。

    本系统汇总合成了上海各调查采录点的有声数据。

  • 一、调查采录点(共12个)
    (一)中心城区(包括黄浦区、徐汇区、静安区、长宁区、普陀区、闸北区、虹口区、杨浦区,方言差别不大):2个,以苏州河为界,南北各一个。
    (二)浦东新区(地域面积大,方言差别明显):2个,分别为川沙和惠南。
    (三)其余各区县:8个,闵行区、宝山区、嘉定区、金山区、松江区、奉贤区、青浦区、崇明县各一个。
    二、发音人
    每个调查采录点7名发音人。其中4名是当地方言的发音人,五六十岁和三十岁左右的男女各1人,分别为老年男性和青年男性、老年女性和青年女性。3名地方普通话(带有当地方言特点的普通话)发音人。
    三、有声数据内容
    每个调查点都按照国家统一的规范和要求,采录了1000个单字、1200个词汇、50条语法例句以及规定内容话语和自选内容话语等的有声数据,以及地方普通话的数据。其中,字、词、例句的发音为音频数据,话语发音为视音频数据。
    根据国家有关规定,现予部分公开。