class PerceptionPair: #初始化一些参数学习率,gram矩阵等等 7 def __init__(self, dataSet, target, learningrate=1): 8 self.lr = learningra ...
感知机算法的原始形式
使用例2.1的数据点作为输入。 class Perception: def __init__(self, learningrate): self.lr = learningrate # 学习率 self.wh = np.array([0.0, ...
zipfile乱码问题
python3.5使用zipfile.ZipFile(“xx.zip”)读取压缩文件为中文的文件时出现乱码 zipfile检测文件编码,如果是’utf-8’编码则解码为’utf-8’,否则解码为’cp437’,修改zipfile.py将’cp437’改为’gbk’即可。 import zipfile ...
连接docker创建的mysql容器时出错
连接mysql容器时报错如下 ERROR 2059 (HY000): Authentication plugin ‘caching_sha2_password’ cannot be loaded: /usr/lib/mysql/plugin/caching_sha2_password.so: can ...
scipy entropy求熵
熵(entropy)是表示随机变量不确定性的度量,熵越大,随机变量的不确定性就越大。 设X是一个取有限个值的离散随机变量,其概率分布为 [latex]P(X=x{i}) = p{i}, i=1,2,\cdot \cdot \cdot,n[/latex] 则随机变量X的熵定义为 [latex]H(X) ...
pandas数据类型DataFrame及基本操作
import pandas as pd df = pd.DataFrame() df[:n] #取前n行 df.loc[行标签,列标签] df.loc['a':'b']#选取ab两行数据,ab为行名 df.loc[:,'one']#选取one列的数据 ...
numpy相关函数
import numpy as np import scipy as sp a = np.ones((2, 3),dtype=int) a.sum(axis=0)#按列相加 a.sum(axis=1)#按行相加 a.ravel()#转为一维 b = a.reshape #返回一个新的修改后的数 ...
在客户机添加路由访问docker集群服务
在局域网(网段为10.68.2.0/24)中通过docker搭建了spark服务,docker容器的网段为192.168.2.0/24。 在相同网段的客户机中要访问docker容器中的服务,可以在客户机添加路由 # linux环境下 10.68.2.xx:为网关,也就是搭建服务电脑的ip sudo ...
numpy中矩阵元素使用分数表示
In [1]: from sympy import Rational In [2]: a = Rational('1/3') In [3]: p = np.array([[0,1,0,0,0],[a,a,a,0,0],[0,a,a,a,0],[0,0,a,a,a],[0,0,0, ...
python求明氏距离
何为明式距离$ P = (x{1},x{2},\cdot \cdot \cdot,x{n}) and Q=(y{1},y{2},\cdot \cdot \cdot,y{n}) \in R^n $ $ D(X,Y) = \bigg( \sum{i=1}^n |x{i} - y_{i}|^p\big ...
python对函数求导
假设函数[latex]f(x) = x^3+2x[/latex],求[latex]f’(x)[/latex]在x=1的值. 1.通过numpy多项式求导 import numpy as np y = np.poly1d([1,0,2,0]) print(y) # 3*x**2 + ...
python排列组合,范数, 中位数相关函数
import numpy as np a = np.array([1, 2, 3]) np.linalg.norm(a, 1) #1-范数 np.linalg.norm(a, 2) #2-范数 x = np.array([1, 2]) y = np.array([1, 4]) dist = np. ...
第1章 统计学习方法概论
统计学习(statistical learning)是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科。统计学习的主要特点: 1.统计学习以计算机及网络为平台,是建立大计算机及网络之上的 2.统计学习以数据为研究对象,是数据驱动的学科 3.统计学习的目的是对数据进行预测与分 ...
通过梯度下降法求最小值
1.梯度下降是迭代法的一种,可以用于求解最小二乘问题(线性和非线性都可以)。在求解机器学习算法的模型参数,即无约束优化问题时,梯度下降(Gradient Descent)是最常采用的方法之一,另一种常用的方法是最小二乘法。在求解损失函数的最小值时,可以通过梯度下降法来一步步的迭代求解,得到最小化的损 ...
python使用最小二乘法求拟合曲线
1.最小二乘法 2.假设4个数据点为:(1, 6),(2, 5),(3, 7),(4, 10),求最佳匹配直线。 import numpy as np x = [1, 2, 3, 4] y = [6, 5, 7, 10] r = np.polyfit(x, y, deg=1) # 对(x,y)拟合多 ...
python标准库之OrderedDict
OrderedDict继承于dict,当插入key时顺序就已经确定了。如插入一个key存在的项,key的顺序不会改变。如果先删除再插入,则会移动到右边。In [5]: d = OrderedDict({'banana': 3, 'apple': 4, 'pea ...