博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
推荐系统 - 基于物品本身的特征来(分类)推荐- 步骤与进阶的knn
阅读量:2224 次
发布时间:2019-05-08

本文共 558 字,大约阅读时间需要 1 分钟。

原文

 

定义

分类器是指通过物品特征来判断它应该属于哪个组或类别的程序!分类器程序会基于一组已经做过分类的物品进行学习,从而判断新物品的所属类别。

eg: 会先计算出与这个物品距离最近的物品,然后找到用户对这个最近物品的评价,以此作为新物品的预测值。

 

步骤

1.我们将这些数据集分为了两个部分,第一部分用来构造分类器,因此称为训练集;另一部分用来评估分类器的结果,因此称为测试集。(如何分两部分:十折交叉验证和留一法,)

2.数据特征值选取。

2.标准化。当不同特征的评分尺度不一致时,为了得到更准确的距离结果,就需要将这些特征进行标准化,使他们在同一个尺度内波动。

3.利用特征值建立向量。

4.通过向量来计算距离,到这里为止搭建了一个分类器(计算距离可以选择曼哈顿等的距离算法)

5.使用第二部分数据来评估分类器,如果ok就来预测(其中使用了混淆矩阵来记录结果,Kappa指标来评估分类器,)

6..预测新物品的类别。

 

进阶的分类算法

knn(k近邻)算法:

ps:

1.KNN算法是分类算法,分类算法肯定是需要有学习语料,然后通过学习语料的学习之后的模板来匹配我们的测试语料集,将测试语料集合进行按照预先学习的语料模板来分类

2Kmeans算法是聚类算法,聚类算法与分类算法最大的区别是聚类算法没有学习语料集合。

转载地址:http://jwafb.baihongyu.com/

你可能感兴趣的文章
Oracle数据库中的(+)连接
查看>>
java-oracle中几十个实用的PL/SQL
查看>>
PLSQL常用方法汇总
查看>>
几个基本的 Sql Plus 命令 和 例子
查看>>
PLSQL单行函数和组函数详解
查看>>
Oracle PL/SQL语言初级教程之异常处理
查看>>
Oracle PL/SQL语言初级教程之游标
查看>>
Oracle PL/SQL语言初级教程之操作和控制语言
查看>>
Oracle PL/SQL语言初级教程之过程和函数
查看>>
Oracle PL/SQL语言初级教程之表和视图
查看>>
Oracle PL/SQL语言初级教程之完整性约束
查看>>
PL/SQL学习笔记
查看>>
如何分析SQL语句
查看>>
结构化查询语言(SQL)原理
查看>>
SQL教程之嵌套SELECT语句
查看>>
日本語の記号の読み方
查看>>
计算机英语编程中一些单词
查看>>
JavaScript 经典例子
查看>>
判断数据的JS代码
查看>>
js按键事件说明
查看>>