晋江文学城
下一章 上一章  目录  设置

6、先定个小标准 ...

  •   万事开头难,要真正把这一套人设生成器给摸清楚,首先还得把人设这玩意给搞清楚。一般在游戏AI里面,像AlphaGo、深蓝那些程序,最难的就是给盘面估值,估得高的那些地方,就是下个回合落子处。人设能不能搞同一套暂且不说,首先你得先搞出来不是?

      邱衍这天还是和小实习生处一块,两人头脑风暴,如何给人设评分,拿出一个人设评判标准。当然最后的标准也不是就这么草率地由两人决定,还得开过会、做过多次对比实验,才能最终定下来。可以说,这一套标准的建立会成为他们日后实验室能够走得多远的保障,标准越客观、越公正,那可发展性、可扩展性就越大。正如老话所说,“磨刀不误砍柴工”,有了悬在半空的标准之刃,才能在落下精准的一刀后,展露出纹理分明的切面啊。

      小实习生先给邱衍介绍了以往他们是怎么给词评分的。现在国家教育基金会里有个语料库的项目,让下面有能力也肯干的各个大学实验室分担了一部分。每个实验室收集整理一类词,首先从词性上分,名词、动词、介词、连词等等,现在词性语料库基本上已经很完整了。然后是分褒贬义,哪些是褒义哪些是贬义词。之后可能还要再针对某些词进行解释,听上去就像是编纂字典似的。小实习生推推眼镜说道:“我们现在就是在用他们的词性语料库和褒贬义语料库作评判标准,词性还好说,但是褒贬义就不太好了。现在语料库里就分了三类,褒义、中性、贬义,虽然说所有词都能分到这三类中的一类,但是互相之间都还是有些差别的,比如罪恶和任性,都是贬义词,但是后者就是要比前者语气轻一些。国家是只能做到分三类了,我们不行,我们得做的更细。”

      邱衍想了想,结合自己以前在实验室做的工作,对这个问题提出了一点想法:“那我们大概需要一支人工标记褒贬程度的队伍……”实习生挥挥手:“这么想也是正常的,当初我们也这么讨论过,但是不现实。一是我们没法衡量工作量,队伍多大,给他们多少时间完成,我们都没个数;二是就算请了这么一批人来,他们对词的褒贬感受都是不一样的,不同人有不同的经历,有的人或许对其中某类词特别敏感,又对某类词特别喜欢,我们是没办法接受将这种个人主观情绪带入到这种客观评判工作里来的。”邱衍也知道这想法不切实际,他以前在实验室做人工分词就快做的吐血了,现在想想以前也是真的傻,就那么埋头苦干,不知道利用手边的工具提高效率。

      邱衍反思,说起来,自己还是没理解计算机研究的真正意义。那些鼓吹人工智能终将毁灭人类的都是群傻·叉,都是一群不懂技术就在那边满嘴喷·粪的社会无聊人士。计算机研究是为了人类更好的生活这一点不说,给人类提供更有力的工具不说,将人类从重复性无效劳动里解放出来不说,能让人类更多地投向创造性工作不说,偏偏说人工智能会让人类走向灭亡,说些不着边际的“人工智能替代论”,真的让人怀疑他们的智商。邱衍以前是真的把计算机研究当研究看,以为还是要像其他学科里的研究一样,多投入人力,却不想,这门科学最初也是最实际的目标,就是给人类提供方便好上手的工具。这从本质上来说,其实和火车、飞机那些也没什么区别啊!技术无罪,是用它的人需要约束啊!这才是人工智能伦理要探讨的,人工智能作恶论,要论的也是拿人工智能去作恶的人啊,关技术啥事儿啊,多怨!

      或许这一点给了邱衍一点启发,他对实习生说:“那么,我们要不要试试,用现有的工具,给这些词的褒贬义定个不那么准确的位呢?”

      实习生疑惑地看着邱衍,有点惊喜又有点迟疑。邱衍神秘地笑笑,问他:“你会写爬虫吗?”

      ~~~~~~~~~~~在等程序跑完的波浪线~~~~~~~~~~

      爬虫(crawler),按照一定规则自动抓取网络上可获取信息。一般的搜索引擎就是一个大型爬虫程序,输入一个关键词,还你一个充满关键词的花花世界。

      邱衍问实习生会不会写爬虫,倒不是想让他去写个和谷歌、百度一样的搜索引擎,而是想让他去抓取一些样本,看看大家在网上都怎么用这些词。当然最简单的还是用统计方法,看看这些个关键词各有多少个“相关结果”。

      邱衍给实习生这样解释:“你看,在当前富强民主文明和谐自由平等公正法治爱国敬业诚信友善的号召之下,网络环境也得到了一定的改善。我们可以大胆地认为,搜索引擎能搜到关键词相关结果越多的,也是被封锁较少的,那么这样的词必须符合社会主义定位,才能免遭网‘警·毒~’手。我之前也做过小范围的样本调查,现在你去个大引擎搜‘善良’,肯定比搜‘狠毒’、‘阴险’这些词的结果要多。至于语义分析,我们可以以后再尝试尝试,现在还是从小做起,恩,就当定了一个小标准。”

      实习生明显眼睛亮了一亮,随后他又说:“听上去很动心,但是我还是得先做一个调查,要搞出一点有说服力的证据。”对上邱衍有些好奇的询问眼光,实习生挠挠头,说:“我先做个统计。咱不是有了褒贬义语料库了么?我把这些词往网上一搜,搜搜看结果,然后看看,这些词在定了褒贬义之后,在网上会有多少的相关结果。”说罢又顿了会儿,在思考什么。邱衍突然觉得这个说法很熟悉,他和实习生左右摇晃的目光偶尔相接,然后两人福至心灵,异口同声开口道:“贝叶斯!”

      要说统计哪家强?贝叶斯公式必称王。P(A and B)=P(A|B)*P(B)=P(A)*P(B|A) ,这一赫赫有名的概率论公式几乎是所有的统计方法的基础,拿到我们这人设问题里头,那就是P(词 and 词是褒义)=P(词|词确认为褒义)*P(褒义词)= P(词确认为褒义|词)*P(词),简单来说就是,要想知道一个词是褒义的概率,也即知道P(词确认为褒义|词),那么就得算P(词|词确认为褒义)、P(褒义词)和P(词),P(词|词确认为褒义)这一项可以通过搜索引擎来确定,在各大搜索引擎去查这些,已经确认为褒义词的词,返回相关结果数,计算其概率。P(褒义词)就通过语料库计算,褒义词占多少比例,至于P(词),就是这个词在所有词中的出现比例,转换一下也很好求。

      就这么短短几分钟,一个简单的贝叶斯模型就建立了。所谓的标准,也通过这样一个简单的模型来表达。

      邱衍又和小实习生讨论了许久,最后一致认定这样的模型太过简单,在初期可以尝试着用用,后期绝壁不能长久。这里头问题太多了!先不论褒词贬用、贬词褒用这些活用用法,搜索引擎返回的结果数也不是那么准确的!不过在关注热点这一问题上,的确是一个很好的导向。网友对某几个词特别感兴趣,这就是热点!哪些人对人设需求最大?要热点的那些人啊!这不就对口了么?

      简单,又粗暴。

      事实上,在很多问题中,能用贝叶斯的,结果都不会太差。当然很好说不上,大多数时候,贝叶斯都是当个baseline,如果能提出一个比贝叶斯要好的方法,那就可以发paper了。如果这个方法又很恰巧地比现在提出的所有方法都好,那就可以去顶会了!邱衍也很激动啊,这才有点摸到学术边缘的感觉。但他隐隐又感到,自己的数学功底不扎实,可能会给自己未来的道路埋雷挖坑。但这种事急又急不来,邱衍暗叹口气,一步一步慢慢来吧。

      两人又对这个贝叶斯模型细枝末节的地方又再探讨了一番,就发现这一天又过去了。现在标准是有了,但是检验标准的代码还没有呢。两人拾掇拾掇,把今天的报告上交给看起来还是奄奄一息的林盏,和众人先后脚出了门,自家去也。

  • 昵称:
  • 评分: 2分|鲜花一捧 1分|一朵小花 0分|交流灌水 0分|别字捉虫 -1分|一块小砖 -2分|砖头一堆
  • 内容:
  •             注:1.评论时输入br/即可换行分段。
  •                 2.发布负分评论消耗的月石并不会给作者。
  •             查看评论规则>>