SEO対策

计算相似度的简单办法:欧几里德距离

介绍一个简单办法来计算相似度,使用欧几里德距离这个办法,看上去名字挺大,其实最后用的是勾股定理。



小例子:
a:对《天龙八部》的打分为8,对《英国文学》的对分为3
b:对《天龙八部》的打分为4,对《英国文学》的对分为6
c:对《天龙八部》的打分为6,对《英国文学》的对分为2

根据数据,画出一个图,如下:
欧几里德距离

每一个点之前的距离就是两个点之前的连线,当完成连线后,就构成一个三角型了,图如下:
欧几里德距离

这个时候要算出a与b之前的距离就很简单了,
(8-4)的平方加上(3-6)的平方,然后再求平方根,得5

根据这个办法再得到a与c的距离,b与c的距离,数值越小相似度越高。
当然想要商业应用就要对比大量的数据,这时候就要抽样了,如果想要最公平的抽样,就要尽可能的随机抽样,随机达到尽可能平均分布,这样才能更真实。计算量可能会非常大,这个办法可能就有点不实用了。

2010-01-11 11:44:00 のブログ記事
twitter

等待ipad 4.2破解

开始看雷蒙德·卡佛的短篇集。。。

等待touch3破解,geohot is real man

cts-v这汽车真是太猛了!!!!

终于拿到了签证.....

雅歌塔克里斯多夫的《第三谎言》,已经看完了

两个前轮胎换成了普利司通的了,后面两个什么时候才能换呢????

在女朋友的允许下我终于买了ndsi

It was the best of times. It was the worst of times --《A Tale of Two Cities》

《神经浪游者》阅读到第18页。。。。没时间看了。。。可能再也看不完了

Philip Kindred Dick的《Minority Report》已经看完了。。。。。

Rss Space