我想将我的第一个数据集中的字符串与所有最接近的常见匹配项进行匹配。
数据如下:
数据集1:
California
Texas
Florida
New York
数据集2:
Californiia
callifoornia
T3xas
Te xas
texas
Fl0 rida
folrida
New york
new york
期望的结果是:
col_1 col_2 col_3 col4
California Californiia callifoornia
Texas T3xas texas Te xas
Florida folrida Fl0 rida
New York New york new york
问题是:
- 如何搜索第一个数据集和第二个数据集之间的公共字符串,并在第二个数据集中生成与第一个数据集中的每个术语对齐的术语列表?
提前致谢。