2012届KDD Cup
Track1任务:社交网络中的个性化推荐系统
根据腾讯微博中的用户属性(User Profile)、SNS社交关系、在社交网络中的互动记录(retweet、comment、at)等,以及过去30天内的历史item推荐记录,来预测接下来最有可能被用户接受的推荐item列表
Track2任务:搜索广告系统的pTCR点击率预估
提供用户在腾讯搜索的查询词(query)、展现的广告信息(包括广告标题、描述、url等),以及广告的相对位置(多条广告中的排名)和用户点击情况,以及广告主和用户的属性信息,来预测后续时间用户对广告的点击情况
数据集:http://www.kddcup2012.org/c/kddcup2012-track1/data
论文:http://www.kddcup2012.org/workshop
Track1任务:音乐评分预测
根据用户在雅虎音乐上item的历史评分记录,来预测用户对其他item(包括歌曲、专辑等)的评分和实际评分之间的差异RMSE(最小均方误差)。同时提供的还有歌曲所属的专辑、歌手、曲风等信息
Track2任务:识别音乐是否被用户评分
每个用户提供6首候选的歌曲,其中3首为用户已评分数据,另3首是该用户未评分,但是出自用户中整体评分较高的歌曲。歌曲的属性信息(专辑、歌手、曲风等)也同样提供。参赛者给出二分分类结果(0/1分类),并根据整体准确率计算最终排名
数据集:http://kddcup.yahoo.com/datasets.php#
论文:http://kddcup.yahoo.com/workshop.php
法国电信运营商Orange的大规模数据中,积累了大量客户的行为记录。竞赛者需要设计一个良好的客户关系管理系统(CRM),用快速、稳定的方法,预测客户三个维度的属性,包括:1、忠诚度:用户切换运营商的可能性(Churn);2、购买欲:购买新服务的可能性(Appetency);3、增值性:客户升级或追加购买高利润产品的可能性(Up-selling)。结果用AUC曲线来评估
相关推荐
KDD Cup 1999数据集特征含义
这个问题激发了一些专家来发现根据数据挖掘来减少错误警报的解决方案,这是在大数据(例如KDD CUP 99)中使用的分析过程的考虑因素。本文对处理入侵检测中的错误警报的各种数据挖掘分类进行了综述。 。 根据测试...
KDDCup99的原始数据来自于1998年的DARPA入侵检测评估项目,所有的网络数据来自于一个模拟的美国空军局域网,网络中加了很多模拟的攻击。实验的训练数据为7周的网络流量,这些网络流量包含有约500万条网络连接;实验的...
分析、测试、验证全套kddcup1999数据集
1、内容概要:本资源主要基于Python实现kdd99入侵检测数据集预处理,搭建DNN和CNN神经网络实现kdd99入侵检测分类,适用于初学者学习入侵检测分类使用。 2、入侵检测数据集: 该数据集是从一个模拟的美国空军局域...
KDD CUP98 的数据集,下面是数据集的部分数据: CONTROLN,TARGET_B,TARGET_D 3,0,0 6,0,0 9,0,0 11,0,0 16,0,0 19,0,0 20,0,0 23,0,0 24,0,0 25,1,25 28,0,0 29,0,0 30,0,0 31,0,0 33,0,0 34,0,0 35,0,0 36,0,0 39,0...
KDD-CUP是公认的数据处理领域内的最高水平的赛事之一,竞赛所用数据往往被数据挖掘初学者用作数据处理训练之用。这是2009年KDD-CUP竞赛所使用数据的small版,非常适合初学者使用。仅供分享
KDD CUP99数据集中kddcup.data_10_percent训练集和corrected测试集字符特征数字化结果。1为原数据txt形式,2为数字化结果。
17年阿里天池 Data Description The road network (Figure 1) here used is a directed graph formed by interconnected road links (Figure 3). A route (Figure 4) in the network is represented by a sequence ...
KDD Cup 2012 Track1 数据集。数据集包含了用户特征和Item特征。文件为百度云链接。可快速下载。
KDD (Knowledge Discovery in Database) CUP 2012的论文集还有PPT,非常齐全。
KDD CUP99全部数据集,用于入侵检测。包含官网下载地址,包含测试集、训练集、10%的测试集和10%的训练集。
完整的KDDCUP数据集。用于入侵检测使用的数据集,具有多种数据攻击方式。。。
KDD CUP98 的数据集,下面是数据集的部分数据: CONTROLN,TARGET_B,TARGET_D 3,0,0 6,0,0 9,0,0 11,0,0 16,0,0 19,0,0 20,0,0 23,0,0 24,0,0 25,1,25 28,0,0 29,0,0 30,0,0 31,0,0 33,0,0 34,0,0 35,0,0 36,0,0 39,0...
KDDCUP99数据集大全,包括总数据集,训练集,测试集等等。。。
KDD CUP 99的一部分数据,分为有标签的和未标签的。方便做初步研究。
kddcup.data_10_percent_corrected与kddcup.data_10_percent_corrected,数据齐全
用于入侵检测的数据测试集,很好用的。如果真的对你有帮助,那真是太好了。
KDD CUP99 数据集是从一个模拟的美国空军局域网上采集来的9个星期的网络连接数据,分成具有标识的训练数据和未加标识的测试数据。测试数据和训练数据有着不同的概率分布,测试数据包含了一些未出现在训练数据中的攻击...
kddcup.data_10_percent