专利内容由知识产权出版社提供
专利名称:一种数据聚类方法专利类型:发明专利发明人:柴磊,许靖
申请号:CN201911183968.1申请日:20191127公开号:CN110956276A公开日:20200403
摘要:本发明提供一种数据聚类方法,该方法包括步骤1:获取原始样本;步骤2:通过原始样本随机生成新样本;步骤3:将原始样本标记为第一样本,并将新样本标记为第二样本,混合得到混合样本;步骤4:对混合样本进行分类训练,并得到具有样本节点的分类模型;步骤5:统计分类模型的样本节点数量,并对分类模型内的样本节点进行特征标记;步骤6:提取样本节点的路径,并基于路径得到样本节点的逻辑结构;步骤7:运用节点筛选算法,筛选重要样本节点;步骤8:统计重要样本节点覆盖的样本,得到聚类的簇。该方法可生成具有局部相似性、可解释性的簇,该方法可更好的应用在现实的聚类问题当中。
申请人:深圳市魔数智擎人工智能有限公司
地址:518000 广东省深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司)
国籍:CN
代理机构:深圳市神州联合知识产权代理事务所(普通合伙)
代理人:周松强
更多信息请下载全文后查看