问题标签 [alteryx]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
workflow - Alteryx:如何删除具有特定名称的列?
当我在 Alteryx 中读取 excel TSV 时,我试图弄清楚如何删除具有特定名称的列?
以下是我收到的示例tsv 数据
name given_name family_name email default_email_language id deactivated blocked incargo created_at logins_count last_login last_ip locked_ips tags Apple Banana Grapes Pineapple fruit1 fruit2
AB CD AB CD abcd@mail.com x 1234 YES YES YES creationdate 23 logindate ipinfo X x YES NO NO NO NO NO
EF GH EF GH efgh@mail.com x 2345 NO NO YES creationdate logindate ipinfo X x NO YES YES YES NO NO
我想删除名为default_email_language
, id
, last_ip
,的列incargo
。
我知道我可以通过选择功能做同样的事情,但问题是数据可能会进一步变化,比如这是水果供应商的数据,我可能有单独的蔬菜供应商的数据。此外,列排列也可以进一步改变。
在这种情况下,我必须创建多个工作流程。我想稍微自动化一下,这样每当数据集发生变化时,它只会获取名称,然后从数据中删除整个列。PS - 列数据完全不相关,可能有也可能没有任何数据。
如果需要,我可以进一步解释。首先,我只需要从数据中删除这些特定列。我尝试在 alteryx 社区中搜索,但没有成功。任何可以给我参考的人也会这样做。
谢谢
string - 在 Alteryx 中将填充字符串转换为固定十进制
我有一个没有标题的大文本文件,其字段由固定宽度分隔。所有数字字段都用零填充。我想使用平面文件中的字段设置将其导入 Alteryx。
我的一些字段应该具有固定小数的格式,例如“常规成本”列是固定小数 9.04 - 小数点前 5 个小数位和小数点后四个。输入示例是“000026300”。所需的输出为 2.63。
我无法弄清楚这个工作的长度和比例要求。
长度 = 9,比例 = 4 给出错误
常规成本:“000023600.0000”太长,无法放入此 FixedDecimal。
apache-spark - 比较 spark 和 alteryx 的性能
我知道火花但对alteryx很陌生。有人可以对我的以下问题有所了解。根据 spark 和 alteryx 的性能进行比较?
另外,alteryx 中究竟存在什么,它可以在几秒钟内完成 ETL 工作(读取)?
sql-server - Alteryx - 从 SQL Server 批量复制到 Greenplum - 需要提示以提高性能
此处需要建议:使用 Alteryx 设计器,我从 SQL Server(10M 行)中提取了一个大型数据集,需要移至 Greenplum DB
我尝试使用 Input Data (SQL Server) 和 Output Data (GP) 进行连接,还尝试 Connect In-DB (SQL Server) 和 Write Data In-DB (GP)
任何方法都需要生命来完成,我必须取消该过程(给出一个想法,在周末它运行了 18 小时并且推进不超过 1%)
任何加速此类海量批量数据加载的好建议或技巧都将非常感激!
我可以控制或修改 SQL Server 和 Alteryx 以提高性能,但在 Greenplum 中不能
提前致谢。
问候, 埃里克
azure - 在 Alteryx 设计器上创建 DTM
我是 Alteryx 的新手,正在尝试用它来分析非结构化数据。我有一列文本形式的描述,我打算使用 K-Means 聚类工具进行主题建模。为了让 K-means 处理文本,我需要将我的文本转换为文档术语矩阵 (DTM),以便它们在聚类工具中显示为连续变量。但是,我正在努力寻找一种可以将文本转换为 DTM 的方法。
有谁知道这样做的方法?我目前正在研究 R 工具,但也不确定如何开始。希望各位高手能帮帮我!
我浏览了有关文本分析的帖子,并意识到大多数都依赖于 Microsoft Azure ML 文本分析宏。但是,我想避免使用宏(不限于每月有限运行以实现可扩展性),而是使用 Alteryx 中可用的工具。
提前感谢大家!
cluster-analysis - Heavily unbalanced/skewed data clusters
I am facing some issues with my k-means clustering results on Alteryx. I am trying to conduct topic modelling on my data set of around 5000 text descriptions. After data cleaning, parsing and removing stop words and common words, I created a Document Term Matrix of 20 words and around 5000 documents.
After running K-Means Clustering on Alteryx, no matter how many clusters I indicated, there will always be only 1 document in all clusters except one with all the rest. For example:
2 Clusters
- Cluster 1: 19 words
- Cluster 2: 1 word
3 Clusters
- Cluster 1: 18 words
- Cluster 2: 1 word
- Cluster 3: 1 word
5 Clusters
- Cluster 1: 16 words
- Cluster 2: 1 word
- Cluster 3: 1 word
- Cluster 4: 1 word
- Cluster 5: 1 word
This clustering behavior happens no matter how many clusters I indicated. Looking for some help to shed some light and identify if these results would mean my data has problems or if I did not use the correct settings?
Thanks in advance!
sql-server - 如何使用 Azure Active Directory 凭据连接到 SQL Server?
我在使用 Alteryx 中的输入数据工具连接到 SQL Server 时遇到了困难。
因此,我使用 Azure Active Directory 使用身份验证模式在 Azure SQL 数据库中登录凭据:Active Directory - 密码。我已经对相关用户进行了测试,并且工作正常。
问题是,在 Alteryx 中,我想连接到 Azure SQL 数据库中的数据。提供的选项是,您需要插入 Windows 或 SQL 身份验证。由于我使用 AAD,我无法访问我的数据。
我尝试了几件事,例如使用 SQL 身份验证并将我的 ID 附加到服务器名称,但仍然失败。
我在想有没有办法将我的 AAD 凭据连接到 SQL 身份验证?就像我正在创建登录名( CREATE LOGIN ),但密码仍然与 AAD 用户相关(我使用 CREATE USER FROM EXTERNAL PROVIDER 创建用户)。
任何输入或信息都将非常有帮助。
谢谢,凯文
azure - Azure 数据工厂调用本地 Alteryx API
我需要从 ADFv2 管道在 Alteryx(本地)开始工作,但找不到这样做的方法。内置的 Web 活动似乎不支持 Alteryx 所需的 OAUTH 1.0 签名过程。尝试配置时,我总是收到错误“调用端点错误”。我尝试过使用 Web Activity + HTTP Linked Service,但找不到正确的方法。我需要对本地 Alteryx API 执行 POST(开始作业)和 GET(获取作业状态),我什至不确定哪个活动是执行此操作的最佳活动。
sql-server - 将收入金额与特定的支出金额相关联
我希望你一切都好。我得到了一组非常具体的数据,我需要按照先进先出的原则将传出的财务金额与传入的财务金额相关联。
我需要能够以类似堆栈的方式确定传出交易来自哪个传入交易。
我已经尝试了几种使用 T-SQL 和 Alteryx 的方法,但还没有成功。
我希望我能收到一些关于这方面的提示。
这是我拥有的数据的源表代码(数据示例):
这就是我想要做的:
因此,您可以看到余额、收入和支出的总和。这很容易做到。
我真正苦苦挣扎的是将费用与他们的收入联系起来——例如,特定费用来自哪些收入,以及收入多少。
我的示例是用逗号分隔的单行方法,但它可以是多行,其中针对特定费用的每个来源收入都有一行。
我希望有人可以帮助我解决这个问题 - 我已经绞尽脑汁好几个小时了。
非常感谢!!!