智能语音唤醒词《商标法》保护路径研究

〖2024/5/30 13:34:40时〗 白兔商标专网提供

【字体: 】【发表评论
信息来源:中华商标杂志  信息整理编辑:白兔
 
        一、问题的提出

        随着科学技术的不断进步,商标的保护范围也在不断迎接着新的挑战。近年来,伴随着人工智能技术的不断发展,人机语音交互的体验日渐普及,智能语音产品市场迅速扩张并下沉。从“小艺小艺”“Hey  Siri”等智能移动设备的语音助手到“天猫精灵”“小度小度”等智能家居设施的语音交互产品,以智能语音唤醒词为代表的新一代人工智能产品成为连接消费者与商家的重要媒介。在智能语音指令不正当竞争纠纷第一案中,法官依据《反不正当竞争法》,认定“语音指令”属于该法第六条及第十七条规定的“权益”,采用了兜底条款对“小度小度”的语音唤醒词进行保护。[1]  在“你好问问”作为诉争商标的商标权无效宣告请求行政纠纷中,国家知识产权局、北京市第二中级人民法院、北京市高级人民法院均主张对“你好问问”这一语音唤醒词依据《商标法》中“他人已经使用并有一定影响的商标”进行保护。[2]  由上述案件的审理可见,智能语音唤醒词确实存在相应的法律权益需要给予保护,即社会实践要求法律理论上对这个问题进行相应地厘清。《反不正当竞争法》和《商标法》在制度目标的设置上具有一定相近性,在适用上彼此也并非二元对立关系。当一行为同时触及两种不同的规则系统时,应赋予当事人以选择权。[3]  目前看,智能语音唤醒词在经过长期使用,具备法律要求的条件后,毫无疑问可以成为《反不正当竞争法》保护的对象。那么,其能否成为《商标法》保护的对象,进而获得商标注册并成为商标专用权的客体则是本文主要探讨的问题。

        二、  智能语音唤醒词的技术特点与概念界定

        智能语音唤醒词本质上属于语音识别技术的一种,只是增加了智能设备的响应、理解与反馈环节。由此,智能语音设备的工作过程大致包括“唤醒―响应―输入―理解―反馈”五个环节。其中,“唤醒”和“输入”可被归为用户的“输入”;“响应”“理解”与“反馈”可被归为智能设备的“输出”。其工作过程大致可描述为:用户发出语音指令唤醒智能设备(唤醒)―>  智能设备监测到唤醒词后被唤醒并准备投入工作(响应)―>  用户发出下一步的工作指令(输入)―>  智能设备根据该指令与其自身预先设定的关键词进行匹配后运行具体程序(理解)―>  根据运作结果向用户进行反馈(反馈)。可见,唤醒行为是用户与智能语音设备进行交互的第一个接触点,唤醒词则是用户使用特定智能设备或应用软件的“钥匙”与“入口”。

        根据设定主体的不同,智能语音唤醒词可分为企业预先设定的唤醒词和用户自定义的语音唤醒词。用户自定义的语音唤醒词由用户为满足自身的个性化需求而自主设定,如对导航软件说“导航回家”。这是一种功能性的、通用性的指令,将“唤醒”和“输入”环节合二为一,语音工作命令的发出可以直接唤醒智能设备并被识别。可见,“用户自定义的语音唤醒词”并未与企业及其产品建立明确、稳定的联系,对用户来说,起不到识别该商品或服务来源的作用。另外,通用语句式的语音指令(如对智能钟表设置的“现在几点了”的语音指令)虽然由企业预先设定,但是用户在使用过程中不会将唤醒词与企业及其产品产生联系。故本文认为,不应称其为“唤醒词”,而应称为功能性、通用性的“语音工作指令”,其属于公共领域的范畴。因此,企业对该类语音工作指令并不享有任何权益,更不会在用户使用过程中产生任何“显著性”。因此,均不属于本文探讨的范畴。

        企业预先设定的语音唤醒词要求用户必须使用企业预先设置的语音唤醒词将智能设备唤醒。根据应用场景的不同,企业预先设定的语音唤醒词又可分为智能设备唤醒词与应用软件唤醒词。智能设备唤醒词主要用于人和机器的物理交互,以智能音箱的指令为代表,典型的如天猫精灵智能音箱的唤醒词“天猫精灵”,  以及小米  AI  音箱、小米电视等众多设备的唤醒词“小爱同学”。应用软件唤醒词以智能语音助手的唤醒词为代表,其并不依附于某一特定的硬件产品,而是作为独立的角色服务于多种设备、多个场景,如各类苹果产品均以“Hey  Siri”为唤醒词;以“小艺小艺”为唤醒词的智能语音助手被应用于华为公司生产的各类产品上。因此,现实司法实践面临并需要解决的问题是企业预先设定的智能语音唤醒词是否具有或通过使用获得显著特征,而不在于通用性、功能性的语音指令,即智能语音唤醒词是否能起到区分和识别作用,满足商标的功能需求。

        三、  智能语音唤醒词的法律保护路径

        从前述的百度在线网络技术(  北京)  有限公司诉北京子乐科技有限公司等不正当竞争纠纷案以及江西开车问问车联网科技有限公司诉国家知识产权局与出门问问信息科技有限公司商标权无效宣告请求行政纠纷案中均不难看出,智能语音唤醒词越来越成为各商业主体参与市场竞争的一部分。根据北京百度网讯科技有限公司发布的《最全人工智能“唤醒词”研究报告》显示,企业对唤醒词的选择会从词语组合、音调平仄以及声母韵母等各方面考量。可见,企业以对智能语音唤醒词的选择与智能设备名称以及企业的主商标高度相关为原则,旨在突出用户使用的有效性,并且要与自己的产品紧密联系。因此,企业对智能设备唤醒词的选择是从场景与使用目的出发的。在人机语音交互逐渐普及的今天,其有很高的市场价值,应当对其进行保护。

        (一)  应通过文字商标进行保护

        对于智能语音唤醒词的法律保护,有学者主张,在单纯的物理层面,在用户唤醒与智能设备实时监测并响应的过程中,唤醒词的具体内容对智能终端来说只是一个物理信号,没有实质意义且无碍于唤醒技术的实现。因此,“关键在于唤醒词当作什么使用而不在于被当作什么去呼叫”。这些学者主张唤醒词是一种技术功能符号,商标是一种商业标记符号,二者在语音唤醒行为中的意义截然不同,因此唤醒行为难以认定为商标使用。[4]  结合本文前述对智能语音唤醒词市场价值的论述,笔者认为,该观点只注重唤醒词本身的物理层面的意义,而忽视了智能语音唤醒词的使用场景与使用目的⸺越简单的符号指代,而产生建立符号与商品之间的联系作用,只是这种符号是通过人的语音输出的方式在传递,但其背后的文字是确定的。其不仅仅只是技术功能指代,而是在此基础上凸显了产品的功能卖点以形成自己的经营优势。因此,“符号说”显然难以囊括智能语音唤醒词的市场价值。

        另外,从智能语音唤醒词的概念出发,似乎很容易将其与“声音商标”产生联系,但是一方面,智能语音唤醒词的“声音”与传统声音商标的“声音”不同。智能语音唤醒词虽由经营者预先设定,但使用该唤醒词的却是不同的用户。不同用户因为生理体质的差异所发出的声音不同,即使是同一用户,其在不同的时间、地点下说话的音量、音调也会有所变化,故语音唤醒词不满足声音商标的一般形式要件,即声音商标不会随场景、地点的变化而发生变化,因为其完全由企业预先制定。而智能语音唤醒词的词语指令的设置与企业注册声音商标的方式类似,均要由企业设计、规定,唯一不同之处便是多了“唤醒”环节,也就是由用户发出指令的环节。而不同用户因为生理差异音色不同,对智能设备进行唤醒时的声音在听觉上会有所不同,但是音调、音色的不同对智能设备的运作并不起决定性作用,智能设备更不会因为前述因素的变化而作出不同的反应。故不应以听觉或者感官不同而当然地得出语音指令不具有唯一性的结论,更不应以此否定智能语音唤醒词在智能语音设备工作过程中的决定性作用。因此,智能语音唤醒词不能作为声音商标进行申请注册。[5]  另一方面,对智能语音唤醒词绝不仅仅是保护“声音”这么简单,最终还是对唤醒词文字内容进行保护,如“小度  小度”,若依普通话标准提交声音样本获得了注册,他人再以四川方言、山东方言进行使用,从听觉上与注册商标完全不同,但是从文字内容上仍有可能造成相关公众的混淆。

        因此,智能语音唤醒词虽然在语音口音表达上会存在差异,可能不符合声音商标的要求,但其文字载体本身是准确固定的。若该词语具有显著性,应当以文字商标方式获得保护,只是这种文字商标的交流与传递是通过语音方式。下文详述智能语音唤醒词显著性的认定方式。

        (二)  智能语音唤醒词的显著性认定

        1.  固有显著特征的判断

        商标是用以识别和区分商品或者服务来源的标志。对于智能语音唤醒词来说,用户在使用相关智能设备时能够通过语音唤醒词识别相关商品的来源,并得以区分不同的智能设备,甚至在没有特定的智能设备时也可以依据不同的语音指令而建立声音与商品或服务之间的联系。比如,“小爱同学”可以使用户直接对应到小米公司的智能音箱、智能电视等系列智能产品;“Hey  Siri”的语音指令也可以使用户直接对应到苹果公司的智能产品。不同公司研发的智能设备或应用软件的语音唤醒词在使用过程中可以起到区分商品或服务来源的作用进而获得显著性。从目前的司法实践来看,智能语音唤醒词是具有一定的显著特征的。在智能语音指令不正当竞争纠纷第一案中,法院认为,被诉公司以与原告公司完全相同的语音指令对其产品进行唤醒和操作,在客观上极易导致相关公众产生混淆,且该语音唤醒词能够使用户将特定商品或服务与其提供者建立起联系,从而损害商品或服务提供者的权益。允许智能语音唤醒词的随意使用,会破坏语音唤醒词自身的区分与识别商品来源的功能,不利于公平竞争的市场经济秩序的建立。

        并不否认,许多智能语音唤醒词在诞生之初可能并不具备《商标法》意义上的显著特征。因此,需要考察其是否能通过使用而获得显著特征。是否能通过使用获得显著性,影响该智能语音唤醒词能否获得《商标法》保护。

        2.  使用获得显著性的可能性

        智能语音唤醒词的语音指令是一种交互式命令,要求用户或者消费者自身发出系统提前设定的声音关键词,被机器接收并分析后,用户或消费者才能享受商品或服务。这个过程不仅不会使用户忽略智能语音唤醒词的存在,反倒会因为其日常的交互使用而强化其印象,不断增加该语音唤醒词的识别与区分性,进而该语音指令便可获得显著性。

        商标是生产经营者在其提供的商品或服务上能够为公众识别商品或服务来源的标记。智能语音指令是商品生产者为商品使用设置的一种专业代码,只要在设置上满足相当的确定性、稳定性甚至唯一性,不随使用场景的变化而变化,且并非通用性声音或功能性声音,便可作为商标注册。如对于百度公司的“小度  小度”的语音唤醒词,若用户发出“嘿  小度”的指令,那么百度公司的智能设备并不会被唤醒,该唤醒词也不会因为场景的不同而变换。因此,智能语音唤醒词是人为设计的,并且是确定的、不属于功能性的,与特定的商品或服务之间具有一一对应的关系。

        商标在商事活动中的主要用途是承载、传播与保护商誉。[6]  智能语音唤醒词在具体的使用场景中,也同样发挥着类似传播与保护商誉的作用。可能在一般情况下,智能语音唤醒词的选择过于简单,缺乏固有显著性,需要通过长期或广泛地使用,且需要与申请主体产生稳定联系并具备区分商品或服务来源的功能才能取得显著特征。但是如前文所述,智能语音唤醒词作为一种交互式语音命令,在日常使用时不仅不会使用户忽略智能语音唤醒词连接消费者与商品的功能,反倒会因为其日常的交互使用而强化用户印象,进而获得显著性。当然,在具体审查时,仍需根据其载体的不同,结合个案证据进行综合考量。如根据北京市高级人民法院发布的《商标授权确权行政案件审理指南》,考察使用智能语音唤醒词的智能设备产品的销售量、销售区域、销售金额或广告宣传,以及其他因素等证据来综合判断该智能语音唤醒词的实际显著性。