3

我使用tldextract(2.2.2 版)从 URL 中提取子域/域/后缀。

我最近注意到一个令我惊讶的结果:

>>> from tldextract import extract
>>> extract('http://althawrah.ye/archives/597366')
ExtractResult(subdomain='', domain='', suffix='althawrah.ye')

不是作为域被拾取,而是althawrah作为后缀的一部分被拾取。 为什么是这样?

稍微窥探一下,我注意到Public Suffice List本身.ye是少数使用前导星号的后缀之一,例如

// fj : https://en.wikipedia.org/wiki/.fj
*.fj
// ye : http://www.y.net.ye/services/domain_name.htm
*.ye

这里的含义是,这些后缀不允许直接在后缀下注册域名,而是必须注册为三级名称。但是,http://althawrah.ye/并非如此;即,未列为 .ye 的二级域。那么,这里发生了什么?althawrah

4

2 回答 2

2

根据列表的历史记录和更新过程的描述,似乎也门条目完全错误或过时。该条目是在 2007 年之前添加的(当列表从 CVS 迁移到 git 时),而列表指南指出:

[针对 ICANN 域] 的更改需要来自注册管理机构的代表(以与下文类似的方式进行验证)或来自注册管理机构网站等公共来源。

列表中链接的网站(自 2002 年以来未更改)提供的细节很少,但确实提到了格式为 www.yourcompany.com.ye 的 URL,这可能是 *.ye 规则的来源。IANA 的根区域数据库将TeleYemen指定为当前的 TLD 管理器,但在其站点上没有提及域注册。2008 年,一名加拿大用户添加了维基百科的所谓“二级域名”列表,该用户链接到一家名为 phpcomet 的公司的已删除网站(存档在这里) 声称在列出的二级域名中出售域名。然而,谷歌搜索“site:ye”显示了这些域之外的大量站点(例如 press24.ye、ndc.ye),并且没有给出其中许多的任何结果(me.ye、co.ye、ltd.ye , plc.ye)。

我不确定可以做些什么来更新官方列表,但如果正确的条目是这样的,我不会感到惊讶:

ye
com.ye
edu.ye
gov.ye
org.ye
于 2019-10-17T15:12:39.440 回答
0

感谢 TeleYemen 和项目维护者,这些更改已合并到pull request 1189中的 publicsuffix/list 中。

该列表现在明确指定子域并删除*星号。

于 2021-03-09T22:42:26.490 回答