跳到内容
跨境Ai视界 跨境Ai视界
Go back

如何用豆包MarsCode,解决关键词库Python清洗

文章目录共 4 节
  1. 创建项目
  2. 执行代码
  3. 修改内容
  4. 总结

上篇文章解决了关键词库数据展示的部分,完成了从Tableau本地客户端,到云Saas数跨境BI的迁移。收到了很多的读者的反馈说,他们已经成功解决数据看板的问题,节省了很多时间。

本着同样的逻辑,我们来解决Python清洗的部分,完成从本地端到云端的迁移。

今天要使用的工具是字节跳动出品的豆包MarsCode。这是一个可以运行代码的云IDE软件,不需要本地配置环境,直接在云端执行。

创建项目

1.首先注册MarsCode,由于是大厂出品,可靠性和安全性上不用担心。

注册链接:https://www.marscode.cn/events/s/iSxwCk2J

Image

2.进入工作台,选择MarsCode IDE。

Image

3.新建项目,选择导入git代码仓库,输入我已经上传到github上的项目链接。

https://github.com/TechTerryDev/amazon-keyword-clean.git

Image

执行代码

1.创建好项目之后,在控制台中,复制这行命令安装依赖。

pip install -r requirements.txt

Image

2.复制命令,创建环境变量。

cp .env.example .env

Image

3.把 .env 文件中的 ZHIPUAI_API_KEY 替换成自己的key。

Image

4.把下载好的表格,重命名为 data.xlsx 并上传项目根目录。点击界面顶部的 “Run” 按钮,执行代码。完成后,下载 output.csv 文件。

Image

到这里,教程就结束了。整个过程极其优雅,再也不用担心本地配置环境的问题。

修改内容

1.首先解决nltk词库报错的问题,我把需要的文件直接放到项目当中,不需要联网调用。

2.添加了环境变量,可以方便的更换api key、智谱模型、筛选系数和聚类数量。智谱模型换成了免费版的GLM-4-Flash。由于我们使用AI分类的需求比较简单,免费的模型足以胜任。

3.代码托管到了github,后续会直接在上面更新,项目链接地址不变。

总结

到目前为止,关键词库三件套已经形成闭环了。首先找到热卖竞品ASIN,通过卖家精灵导出扩展词,用python清洗表格,用AI给关键词分类,最后在数跨境BI中,生成可视化效果。

第一部分-方法论

https://www.amzalysis.com/article/amazon-keyword-library

https://www.amzalysis.com/article/amazon-sales-breakthrough

第二部分-Python清洗(本篇)

https://www.amzalysis.com/article/keyword-library-python

第三部分-数据分析

https://www.amzalysis.com/article/keyword-library-upgrade

整个过程,本着运营的逻辑,加上个人的思考,借助AI工具,结合读者的反馈,完成从本地到云端的迁移。

即使有了这么多丰富的工具,我也会经常提醒自己,产品和需求才是第一。在AI逐渐成型的今天,工具的价值在于更好的辅助运营,我们可以将更多精力放在提升产品质量和用户体验上,这才是运营工作的核心所在。


Share this post on:

上一篇
想在任何一个领域赚钱,你需要具备至少两种能力
下一篇
亚马逊关键词库升级-用数跨境BI展示可视化