问题标签 [language-detection]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
67 浏览

ruby - 用于确定应用程序描述是否用英文编写的算法错误

我们对 Apple App Store 上的应用程序进行索引,但需要过滤掉那些描述不是用英文写成的应用程序。

但是,我们当前的算法失败了。例如,它在为这场比赛打分时失败了,因为它不是用英文写的。

这是我们用来确定某些内容是否被视为英语的布尔方法和正则表达式:

有没有更好的办法?我们正在使用 Ruby。

0 投票
2 回答
2447 浏览

java - java语言检测LangDetectException

在 java 中进行语言检测时,我尝试使用 langdetect 库,但在线程“main”com.cybozu.labs.langdetect.LangDetectException: need to load profiles 中运行 Exception时出现此错误。有人可以帮我添加个人资料吗?我不知道它看起来像。

问候,

0 投票
1 回答
2825 浏览

php - 如何检测用户输入的语言

我已经在这件事上苦苦挣扎了两天,但仍然找不到任何有用的东西。

有人可以建议我任何可以有效检测提交表单的语言的方法,无论是任何插件或 API,我都可以在我的 php 应用程序中使用它们。

如果以下方法对您可以提出的请求数量没有限制,那么它们将非常适合我。

谷歌提供语言检测库,看起来很适合我,但我完全不清楚如何使用它。

是否有任何有效的方法可以即时检测用户输入(短文本)的语言?或者也许有人可以帮助我弄清楚如何将 Google 检测库与 PHP 一起使用?

(在我的应用程序中,每种语言都执行不同的脚本,因此我需要检测提交表单的语言,以确定要执行的脚本)

0 投票
2 回答
1145 浏览

solr - 在索引期间在 solr 4.5.1 中自动检测语言

我需要你的帮助。我想在 solr 的索引时间内检测韩语和英语。

我的 solr 目录结构是

首先,我将一些库(jsonic-1.2.7.jar,langdetect-1.1-20120112.jar,solr-langid-4.5.1.jar)复制到特定目录(/usr/share/solr/lib/langid) - 我的solr 位于

我的 solrconfig.xml 是

和 schema.xml 是

我阅读了一些书籍并搜索网络以获取有关在 solr 中检测语言的信息,但无法检测语言。我的错是什么?

如需更多信息,请添加我的 post.sh 并登录

这是 post.sh

索引期间的部分tomcat日志

我找不到任何其他警告或错误。我需要你的建议 谢谢大家

0 投票
1 回答
1177 浏览

python - python中的语言检测代码

因此,我们在 python 中构建了一个语言检测程序,它只检测不同的语言。我们的代码看起来不错;没有错误,但我没有得到想要的结果。每当我在 Eclipse 上运行它时,它都会运行并终止,为我们提供运行时间和“OK”。它应该打印所写文本的语言。

0 投票
1 回答
379 浏览

machine-learning - 用于命令行的快速语言检测器

我想问你是否可以向我推荐一些支持捷克语的语言检测工具。

我曾尝试使用https://code.google.com/p/language-detection/但它很慢,因为对于我想要分类的每个实例,我都必须使用输入创建一个文本文件。没有选项可以通过参数检测命令行中的文本。

我正在使用 Windows。

谢谢你的建议

0 投票
2 回答
3321 浏览

typo3 - 使用浏览器语言设置来设置语言 (rlmp_language_detection)

我尝试在我的typo3 6.2 One-Tree Page 中自动设置语言。

在我的设置中,我使用 RealURL 将语言添加到 URL,我使用默认L参数。我不使用语言的 ISO 代码,但我使用 static_info_tables 来设置 ISO 代码。对于语言切换,我尝试使用扩展名rlmp_language_detection,但它不起作用。

我的语言配置(typo3name,官方 ISO 代码 - 使用 static_info_tables 选择,ID - 用于L参数)

  • 默认,-,0
  • en-jp, en, 1
  • en-us, en, 2
  • jp-jp, ja, 3

我的插件打字稿:

我的语言排版:

为了测试它,我将我的第一种语言设置为日语,当我请求 rootpage 时,这在我的请求标头中:

http://mybrowserinfo.com/说:

但是根本没有L设置参数,所以我得到了默认语言。

0 投票
2 回答
81 浏览

java - 从文本中确定人类语言:: 系统结构

我正在使用这些单词列表

现在我只想到德语、俄语、英语和法语。

我想我要做的是将它们全部作为哈希图的一部分,每种语言一个,单词作为键,布尔值作为值。

当我得到输入文本时,我将搜索所有列表,并且将返回命中最多的列表作为答案。

也许我会尝试使用多线程并使用不同的线程同时搜索每个字典。

这是解决这个问题的好方法吗?

0 投票
1 回答
735 浏览

apache - Solr 中用于 Nutch 文档的语言检测

如何使用Solr对nutch爬取的文档进行语言识别?

我安装了Nutch 1.9Solr 4.8.1"core-test" 我在 Solr Admin 页面中添加了一个新核心,通过 Core Admin命名为 solr,并按照Solr wiki中的步骤在文档索引期间进行语言检测。

我通过添加字段修改了 core-test/conf 中的schema.xml

然后,我使用 Nutch 爬取了一组网页

Nutch 工作正常,但未识别文档的语言,即language_s当我在http://localhost:8983/solr/#/core-test/query中进行查询并将q设置为时,我没有获得该字段":"

0 投票
1 回答
518 浏览

typo3 - 语言检测在 Typo3 6.2.12 中不起作用

我有一个有 2 种语言的网站:默认为德语(de)和翻译为英语(en)。我正在尝试使用扩展名“rlmp_language_detection”7.0.0 版在网站中实现语言检测功能。

我想要实现的是,对于奥地利 (at)、瑞士 (ch) 和德国 (de) 国家,网站应保持默认语言德语,而对于所有其他国家,其他国家/地区的用户应以英语查看网站.

我添加了下面的打字稿来实现这一点。但不再工作了;

你能帮我解决这个问题吗?提前致谢。