一、三点检验小课堂
三点检验(Triangle test)是感官实验中使用非常频繁的一类差别检验,也常称为三角检验,是用来确定2个产品(A和B)是否存在可感觉到的感官差别或相似的一种方法。国家标准GB/T 12311—2012《感官分析方法 三点检验》给出了三点检验具体操作指导。三点检验测试时设置3个样品(2个A产品1个B产品,或者1个A产品2个B产品),要求评价员必须选择1个与其他两个不一样的产品。因此,三点检验属于一种强迫选择的方法,即使评价员无法确定哪个产品不同,也必须给出1个答案(需注明是猜测答案)。需要注意一点,三点检验主要用于差别特性不确定的情况,即不需要知道是什么感官特性导致的样品不同(啥不同?),也无须指出差异强度大小(哪个更强?)。这也是三点检验与成对比较、定向3-AFC的关键差异。
二、差别or相似,相同与不同
三点检验中,根据检验目的不同给出了差别检验和相似检验2种方法,差别检验用于确定产生可感知的差别,相似检验用于确定未产生可感知的差别。差别和相似,看上去似乎相同也不同,那到底有何异同呢?差别和相似检验,使用相同的评价员资质和测试程序。
——相同的评价员资质:差别检验和相似检验都要求使用资质一致的评价员,同时评价员都应熟悉三点检验的技术方法。
——相同的测试程序:差别检验和相似检验都使用相同的测试程序,包括测试环境、样品准备和呈送、回答表、品评顺序和具体要求等。测试时都是问相同的问题:哪一个样品是不一样的?
差别和相似检验,使用不同的评价员数量、敏感性参数和结果判别方法。
——不同的评价员数量: 评价员数量通常取决于达到检验所需要的敏感度。评价员数量越多,检出产品间微小差异的可能性越高。通常,差别检验所需评价员数量为24-30人,而相似检验达到同样敏感度,则需要约2倍数量(约60人)。
——不同的敏感性参数设置: 差别检验的敏感性参数为α-风险(Ⅰ类错误),而相似检验敏感性参数为β-风险(Ⅱ类错误)和Pd(能检验出样品感官差别的评价员比例)值。
——不同的结果分析与表述: 差别检验根据正确回答数和设置的敏感性参数α-风险进行结果分析,当正确答案数大于或等于要求数量时,结论表述为:存在感官差别。相似检验结果分析是根据正确回答数和设置的敏感性参数β-风险和Pd值进行结果分析,当正确答案数小于或等于要求数量时,结论表述为:不存在显著差别。
三、相似检验是找“差异”?
这里很多感官君就困惑了,相似检验不应该是找相同吗?为啥测试时还是要找不同?而且结论也不是相似,而是“不存在显著差别”?要说清这个,首先我们要再看看相似检验的定义。GB/T 12311—2012中指出,相似是指“样品间的感官差别小至产品可互换的状态”。什么意思呢?就是说,相似不等于相同或一样。就像我们常说,世界上没有2片一模一样的叶子,只要检测手段足够,我们就可以找到2个样品的差异,就像即使是同卵双胞胎,他们的DNA也不会完全相同。
同样,感官检验中,当我们替换原料、调整工艺或是货架期品质变化测定时,产品一定发生了变化,即一定会存在差异。关键只在于这个差异是否足够达到被人类感官器官所感知,或者说,是否有足够多的人(感知到差异的人群比例)
能够感受到产品差异?结合统计手段,设置一个置信水平,如果感受到产品差异的人群比例没有达到这个水平,ok,我们就可以认为,在统计水平上,2个产品之间不存在明显感官差别,即产品“相似”,大多数评价员或者消费者不会感受到产品之间存在差异。
因此,相似检验的核心同样是“找差别”,只是当感受到差别的人群比例未达到假设条件时,则认为不具有实际意义,产品“相似”。
四、差别PK相似检验,谁更胜一筹?
既然相似检验还是找差别,那检验时应该如何选呢?通常,如果检验目的是确定产生了可感知的差别,则选择用差别检验;如果检验目的是确定未产生可感知的差别(即相似)。则选择相似检验。因此,根据检验目的不同进行选择是最常见的选择方式。但日常应用时,选择差别检验会更多。差别检验需要18人以上评价员,通常24~30名,而且可以使用重复检验数据,例如可以使用10个评价员、3次重复检验的结果。相似检验需要评价员数量不少于30人,而且不允许使用评价员的重复评价结果,例如需要选择30个评价员、单次检验的结果。因此,由于差别检验需要评价员数量更少从而更容易开展,时效性强,应用也更广泛。
五、差别&相似检验,真的不一样吗?
这时又有人问了,如果检验目的也想确定未存在可感知的差异,但因为评价员数量不够,选择了差别检验,那结果会不会与相似检验有差异导致错判呢?接下来,我们就来看下2种检验结果是否会有差异。按照GB/T 12311—2012中的表A.3,确定不同敏感性参数设置下需要的评价员数量。再根据标准中的表A.1和表A.2,确定差别检验中不能拒绝“无差别”所需的最大正确答案数和相似检验中接受“无差别”所需的最大正确答案数,结果如下表所示。由上表可知,大多数情况下,差别检验中不能拒绝“无差别”所需的最大正确答案数和相似检验中接受“无差别”所需的最大正确答案数相同,表明在选定了α、β和Pd水平时,大多数情况下采用差别检验和相似检验能够获得一致的“无差别”结果。但需要注意的是,也有部分情况下,相似检验中接受“无差别”的最大正确数比差别检验中不能拒绝“无差别”的最大正确数小1(或大1),表明在这种情况下,当检验结果中的正确答案数正好处在差别检验中不能拒绝“无差别”的最大正确数(或相似检验中接受“无差别”所需的最大正确答案数)时,采用相似检验则是拒绝“无差别”的结果(或采用差别检验则是拒绝“无差别”的结果),2种检验方式结果刚好相反。因此,当检验结果正确答案数处于临界值附近时,这时候结果判别时则需要更加严格。企业应用时可以根据情况进行调整,满足实际的检验需求。
因此,从统计角度上,差别检验中的不能拒绝原假设“无差别”并不等于接受原假设“无差别”,因为假设检验存在2类错误,我们也不知道检验的power。但从仅从结果反推来看,大多数情况下,采用差别检验中不能拒绝“无差别”所需的最大正确数与相似检验中接受“无差别”所需的最大正确数是基本相同的。因此,实际应用时,当选定了α、β和Pd水平后,可以考虑直接使用差别检验进行2个产品的比较,执行起来操作也更加简便,也不用担心与相似检验结果不一致。
六、结语:相似检验的三问?
存在即合理。既然有了“相似检验”,尽管任务可以交给差别检验,但也留给了我们一些思考:相似检验从何而来?发挥了什么作用?未来咋应用呢?带着这个问题,让我们一起在感官的花园中挖一挖吧。感官之路漫漫兮,带着问题继续求索兮。来源:感官与消费科学