最近,从朋友那里传来一份文件,有关日本站前20000类目关键词的数据。由于亚马逊不太喜欢公开自己的内部数据,所以估计这份数据的来源是用人工智能爬取出来。其实,现在市场上有很多类似这样的数据,无论是AI抓取还是内部资源,其表现形式都仅仅停留在一张表格上面。就是说如果我们要获取相关的结果,还需要做进一步的处理。
一个简单的数据分析思路是提出问题-理解数据……继续阅读 »
Terry
4年前 (2019-02-20) 1798浏览 0评论
0个赞
正态分布也叫常态分布,是连续随机变量概率分布的一种。自然界、人类社会、心理和教育中大量现象均按正态形式分布,例如能力的高低,学生成绩的好坏等都属于正态分布。它随随机变量的平均数、标准差的大小与单位不同而有不同的分布形态。
结合亚马逊数据,可以预估其中一个符合正态分布模型的是产品的定价。下面,我随机抓取一个类目的数据,对价格进行分析。由于数据为连续变量……继续阅读 »
Terry
4年前 (2019-02-20) 1561浏览 0评论
1个赞
“底层逻辑”是个经常被互联网提到的概念,说的是放之四海而皆准的道理,每个领域共通的临界点。在商业和数学的世界,有两个经常被提起的概念,幂律分布和正态分布。这篇文章的底层逻辑是结合一个符合统计分布的实际场景,然后用数据去证明。如果在一定程度上可以被证明,就可以当作规律。由于我从事亚马逊的相关工作,所以本篇文章是围绕亚马逊展开。
由于亚马逊对自己的销售数……继续阅读 »
Terry
4年前 (2019-02-20) 1722浏览 0评论
2个赞
1 自我介绍
以前我从事的行业是传统贸易,以线下接触客户为主。去年开始转行做跨境电商,发现这完全和之前的工作是两码事,虽然都叫外贸,但从认知、效率、工作方法上都有了不一样的认识。有段时间我一直在找能够提高效率的工具和方法。如果从成甲的《好好学习》中提到的知识管理维度来划分,以前我是在第一阶段数据管理,现在逐步进入第二阶段信息管理。“工欲善其事必先利其……继续阅读 »
Terry
4年前 (2019-02-15) 1476浏览 0评论
2个赞
一、描述统计分析
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
path='键盘AB测试.xlsx'
xls=pd.ExcelFile(path,dtype='object')
data=xls.parse('Sheet1',dtype='objec……继续阅读 »
Terry
5年前 (2018-05-22) 1583浏览 0评论
0个赞
一、描述统计分析
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
path='data.csv'
data=pd.read_csv(path,encoding='GBK')
data.head()
data.describe()
……继续阅读 »
Terry
5年前 (2018-05-21) 1700浏览 0评论
0个赞
一、描述统计分析
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
dataSer=pd.Series([15.6,16.2,22.5,20.5,16.4,
19.4,16.6,17.9,12.7,13.9])
……继续阅读 »
Terry
5年前 (2018-05-21) 1255浏览 0评论
0个赞
学习概率分布的基本思路是先明确这个分布有什么用,接着如何去检验,然后如何计算概率,最后在Python里实现。Pyhton实现的步骤是先定义随机变量,之后计算概率,最后用可视化展现出来。
1 离散概率分布-伯努利分布
import numpy as np
import matplotlib.pyplot as plt
from scipy imp……继续阅读 »
Terry
5年前 (2018-05-01) 1268浏览 0评论
0个赞
1. 提出问题
这次,我的客户是一个新成立的电影制作公司。他们将制作一部新电影,并确保电影能够成功,从而立足市场。客户希望我们咨询公司可以帮助他们了解电影市场趋势,做出正确的决策。他们提供了三个研究领域:* 问题 1: 电影类型是如何随着时间的推移发生变化的?* 问题 2: Universal Pictures 和 Paramount Picture……继续阅读 »
Terry
5年前 (2018-04-26) 1431浏览 0评论
0个赞
1. 建立数据集
from collections import OrderedDict
import pandas as pd
import numpy as np
examDict={
'学习时间':[0.50,0.75,1.00,1.25,1.50,1.75,1.75,2.00,2.25,2.50,
2.……继续阅读 »
Terry
5年前 (2018-04-02) 1366浏览 0评论
0个赞