问题标签 [computer-vision]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
946 浏览

python - 启动语义图像识别

如何识别(不)合适的图像?

为了促进、启用和简化针对 gae 的照片和图像审核和管理,我尝试开始使用基本的 python 图像识别,即图像看起来像什么的基本语义信息阻止可疑材料直到人类能够判断它,并批准最多很好。一个测试批次 > 10 000 张图像有一个或只有很少几个,因此自然避免误报是好的。我找到了以下链接,并提前感谢大家的所有建议、建议和建议。基本上,审核将显示许多图像,只有一个按钮“ok”或反之默认“ok”和一个按钮“不赞成”,具体取决于默认决定(默认可能会发布所有内容,如果有些不合适,则临时(人)不赞成,因为绝对主要部分 > 链接文本

链接文本

0 投票
1 回答
470 浏览

computer-vision - Downhill Simplex Method

Is it possible to use Downhill Simplex Method for template matching?Let's say I have 40 landmarks on the edges of an object and I have pixel intesities of normal vectors on these landmarks and I want to use Downhill Simplex Method for strecthing the template I have with iterations after each iteration i will check mean square of errors of the pixels I have in the template object and image I am working on?Anyone got an idea?Thanks

0 投票
4 回答
8831 浏览

python - OCR 扑克牌

我决定做一个有趣的项目,我想将扑克牌的图像作为输入并返回其等级和花色。我认为我只需要查看左上角,因为它包含所有信息。它应该是健壮的——如果我有一张钻石王牌的大图像,我应该能够将它缩放到 20% 到 200% 的任何位置,并且仍然得到正确的答案。

第一个问题 - 是否有任何已经写过的东西可以做到这一点?如果是这样,我会为 OCR 找到其他东西,所以我不会重复这些努力。

第二 - 这样做的最佳方法是什么?神经网络?手工编码的东西?任何人都可以提供任何指示吗?(0xCAAF9452 不是可接受的答案)。

0 投票
5 回答
2690 浏览

c++ - 寻找图像偏移

如何使用编程语言 vb.net 或 C++ 或 C# 在相同的两个图像之间找到移位和旋转?

0 投票
4 回答
36875 浏览

image-processing - 使用霍夫变换进行矩形检测

基于 this paper ,我正在尝试使用霍夫变换实现矩形检测。

我使用Matlab编程,但是在检测到平行线对和正交对之后,我必须检测这些对的交集。我的问题是关于霍夫空间中两条线交点的质量。

我通过求解四个方程组找到了交点。这些交点是否位于笛卡尔或极坐标空间中?

0 投票
2 回答
11332 浏览

opencv - OpenCV:检测视频源中的闪烁灯

我有一个视频源。此视频源包含几个以不同速率闪烁的灯。所有的灯都是相同的颜色(它们都是红外 LED)。如何检测这些闪烁灯的位置和频率?

免责声明:我对 OpenCV非常陌生。我确实有一份Learning OpenCV的副本,但我发现它有点压倒性。如果有人可以用 OpenCV 术语解释解决方案,将不胜感激。我不希望为我编写代码。

0 投票
4 回答
4637 浏览

algorithm - 开始学习边缘检测/图像识别的最佳文章

我参与了一个个人项目,该项目需要非常广泛的边缘检测和图像分割/对象识别知识。

我知道在编写代码之前计划/理解的重要性,考虑到这一点,了解这些计算领域的最佳起点是什么?我理想地寻找在线文章/论文。

谢谢

0 投票
2 回答
16186 浏览

computer-vision - 从立体图像中获取深度图的库?

我将设置一些设备来执行实时 3D 运动跟踪。我这样做的第一个想法是使用一对相机拍摄立体图像并计算深度图以获得我需要的 3D 数据。

是否有任何好的开源库 (C/C++) 可用并且足够快用于实时(~12-24fps)?我在 SourceForge 中找到了使用 Stereo VisionEStereo的 3D Reconstruction ,有人尝试过吗?

或者我可以实施的任何算法建议?

0 投票
1 回答
6655 浏览

c# - 霍夫变换问题

我以这种方式在 C# 中实现了霍夫变换:

所以,据我了解,我现在已经找到了所有曲线相交点的 theta 和半径。那我怎么才能找到真线呢?

有人声称我需要找到斜率和一个点,但我现在真的不清楚该做什么。

谢谢你的帮助,乔纳森

0 投票
2 回答
1550 浏览

image-processing - OCR - 大多数“不同”或“可识别”的 ASCII 字符?

我正在寻找一种方法来确定最“不同”或“可识别”的 N 个 ASCII 字符...例如,如果 N = 10,从 0x21 到 0x7E 的 ASCII 集中最不同的 N 个字符是什么?显然,字符“X”与“O”(字母)非常不同,但“O”(字母)与“0”(零)非常相似。假设一个受限制的 OCR 字符子集,这样零和字母 O 将被检测为一个或另一个,并且不必担心它是零还是字母 O,那么最不同的 N 是什么典型的 OCR 引擎(例如 Tesseract)容易从质量差的输入图像中识别出的字符?假设。例如“+”和“t”可能会被广泛地误认为是彼此。可以制作,

谢谢,本