问题标签 [classification]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
18377 浏览

java - 在java中制作决策树的最佳学习算法?

我有一个数据集,其中包含年龄、城市、儿童年龄等信息以及结果(确认、接受)。

为了帮助对“工作流程”进行建模,我想根据以前的数据集自动创建一个决策树。

我看了一下http://en.wikipedia.org/wiki/Decision_tree_learning,我知道问题显然并不明显。

我只想就这个主题的一些算法或一些库提供建议,这些建议可以帮助我构建基于样本的决策树。

0 投票
3 回答
1283 浏览

java - Java中的文本分类

我需要某种 Java 解决方案来满足以下要求:

  1. 在文本中搜索某些术语(每个术语可以是 1-3 个单词)。例如:{“你好世界”,“你好”}。匹配需要准确。
  2. 大约有 500 种术语组,每个组包含大约 30 个术语。
  3. 每个文本最多可包含 4000 个单词。

性能是一个重要问题。

谢谢, 罗德

0 投票
3 回答
618 浏览

matlab - 向量的尽力分类算法

给定四个表示“类”的二进制向量:

哪些方法可用于将浮点值向量分类为这些“类”之一?

在大多数情况下,基本舍入有效:

但是我该如何处理一些干扰呢?

第二种情况应该更适合 1000000000,但相反,由于没有明确的匹配,我完全失去了解决方案。

我想使用 MATLAB 来完成这项任务。

0 投票
4 回答
1114 浏览

algorithm - 潜在语义索引 (LSI) 是一种统计分类算法吗?

潜在语义索引 (LSI) 是一种统计分类算法吗?为什么或者为什么不?

基本上,我试图弄清楚为什么统计分类的维基百科页面没有提到 LSI。我刚刚开始研究这些东西,我试图了解所有不同的分类方法是如何相互关联的。

0 投票
6 回答
22687 浏览

c++ - 知道任何好的 c++ 支持向量机 (SVM) 库吗?

你知道那里有什么好的 c++ svm 库吗

我也听说过SVMLightTinySVM。你试过了吗?有新玩家吗?

谢谢 !

0 投票
4 回答
1213 浏览

python - 根据共性对字符串数组进行分类

我有大量的字符串(多字)列表(200000)。我想根据这些字符串之间的单词匹配的comman数组对这些字符串进行分组。我想不出一个低计算时间的算法

AB 500
“巴士AB 500
新闻 CA
新闻 CA BLAH”

我的计划是
一个。将它们标记为单词。
湾。创建一个全局数组令牌
c. 将这些字符串与常见标记进行比较。

正如您所猜测的那样,这无济于事。你能为此建议一个算法吗?我正在用python写这个..

0 投票
3 回答
1827 浏览

machine-learning - 关于使用机器学习工具 Weka 的问题

我正在使用 Weka 的资源管理器功能进行分类。

所以我有我的 .arff 文件,具有 NUMERIC 值的 2 个特征,我的类是二进制 0 或 1(例如 {0,1})。

样本:

我加载这个 .arff 文件,使用 10 倍交叉验证(无测试文件),然后选择 NaiveBayes,然后我对数据进行分类,它给了我:5 个错误标记,100 个正确标记。到现在为止还挺好。

现在,我显着更改了我的 .arff 文件(为我的特征属性提供完全随机的值)。重复上述操作,我在分类时得到完全相同的统计数据。

我尝试对我的 .arff 文件进行更多更改,使用不同的分类算法。尽管如此,无论我给我的 .arff 文件赋予什么值,完全相同的统计数据(在相同的算法中)。

我在这里做错了吗?

0 投票
1 回答
1148 浏览

url - 使用 JAVA 读取在浏览器地址栏中输入的 url

我想编写一个将 url 分类为恶意和良性的 java 应用程序。即,当用户在地址栏中键入一个 url 时,我的程序应该读取该 url ,对其进行分类,如果它是恶意的,则将其阻止。用户输入后,如何从浏览器的地址栏中读取 url..

请帮忙..

谢谢

0 投票
2 回答
419 浏览

url - 在线网址分类器

我想编写一个在线应用程序:

  1. 从浏览器地址栏读取 URL
  2. 提取其词汇特征(如 n-gram)
  3. 提取其基于主机的特征(在线获取 DNS 记录、其 A、PTR、TTL 字段)
  4. 将 URL 分类为恶意或良性(使用机器学习)

谁能帮我解决1和3?

0 投票
6 回答
1070 浏览

classification - 有谁知道软件分类的任何标准?

当然,我尝试过 Google/Bing 并找到了针对特定行业的一两个分类,但没有什么通用的。我正在寻找的东西是:General Office Tools -> Wordprocessing -> Word Utilities -> File Management -> Compression -> Winzip

我所追求的是某个组织发布的标准,或者被我的多个不同方使用 - 而不仅仅是单个组织正在使用的分类。