TensorFlow2.1入门笔记1
基础知识
张量(Tensor):多维数组(列表) 阶:张量的维数
0阶张量表示标量,例:a=1 2 3
1阶张量表示向量(一维数组),例:a=[1,2,3]
2阶张量表示矩阵(二维数组)可以有i行j列,每个元素可以用行号和列号共同索引到,例:a=[[1,2,3],[4,5,6],[7,8,9]]
判断张量是几阶的,看t=[[[[[…的括号有多少个
张量表示0阶到n阶的数组
TensorFlow的数据类型
tf.int,tf.float
tf.int32,tf.float32,tf.float64
tf.bool
tf.string
等
如何创建一个Tensor
直接创建
tf.constant(张量内容,dtype=数据类型(可选,本机默认是tf.int32))
例:
import tensorflow as tf
a = tf.constant([1, 5], dtype=tf.int64)
print("a:", a)
print("a.dtype:", a.dtype)
#运行结果
#a: tf.Tensor([1 5], shape=(2,), dtype=int64)
#a.dtype: <dtype: 'int64'>
#a.shape: (2,)
将numpy的数据类型转换为Tensor
tf.convert_to_tensor(数据名,dtype=数据类型(可选,本机默认是tf.int32))
import tensorflow as tf
import numpy as np
a = np.arange(0, 5)
b = tf.convert_to_tensor(a, dtype=tf.int64)
print("a:", a)
print("b:", b)
#运行结果:
# a: [0 1 2 3 4]
# # b: tf.Tensor([0 1 2 3 4], shape=(5,), dtype=int64)
创建全为某个值的张量:
全为0:tf.zeros(维度)
全为1:tf.ones(维度)
维度:一维直接写个数,二维[行,列],多维[n,m,j,k…]
全为指定值的张量:tf.fill(维度,指定值)
import tensorflow as tf
a = tf.zeros([2, 3])
b = tf.ones(4)
c = tf.fill([2, 2], 9)
print("a:", a)
print("b:", b)
print("c:", c)
#运行结果
# a: tf.Tensor([[0. 0. 0.][0. 0. 0.]], shape=(2, 3), dtype=float32)
# b: tf.Tensor([1. 1. 1. 1.], shape=(4,), dtype=float32)
# c: tf.Tensor([[9 9][9 9]], shape=(2, 2), dtype=int32)
生成指定维度符合正态分布的张量
tf.random.normal(维度,mean=均值,stddev=标准差)(默认mean=0,stddev=1)
要想数据更加集中可以生成截断式正态分布的随机数:
tf.random.truncated_normal(维度,mean=均值,stddev=标准差)
可以让数据在(μ-2σ,μ+2σ)间
import tensorflow as tf
d = tf.random.normal([2, 2], mean=0.5, stddev=1)
print("d:", d)
e = tf.random.truncated_normal([2, 2], mean=0.5, stddev=1)
print("e:", e)
# 运行结果可见第二种方法数据更向0.5集中
# d: tf.Tensor(
# [[-1.4998953e+00 7.1462959e-01]
# [-1.0406375e-03 6.1626345e-01]], shape=(2, 2), dtype=float32)
# e: tf.Tensor(
# [[-0.7189257 -0.77654326]
# [ 1.2663629 1.0182645 ]], shape=(2, 2), dtype=float32)
生成均匀分布的随机数
tf.random.uniform(维度,minval,maxval)
import tensorflow as tf
f = tf.random.uniform([2, 2], minval=0, maxval=1)
print("f:", f)
# f: tf.Tensor(
# [[0.21811843 0.3118713 ]
# [0.2081083 0.52303874]], shape=(2, 2), dtype=float32)
常用函数
强制类型转换:
tf.cast(张量名,dtype=数据类型)
计算张量维度上元素的最大(小)值
tf.reduce_max(张量名)
tf.reduce_min(张量名)
import tensorflow as tf
x1 = tf.constant([1., 2., 3.], dtype=tf.float64)
print("x1:", x1)
x2 = tf.cast(x1, tf.int32)
print("x2", x2)
print("minimum of x2:", tf.reduce_min(x2))
print("maxmum of x2:", tf.reduce_max(x2))
# x1: tf.Tensor([1. 2. 3.], shape=(3,), dtype=float64)
# x2 tf.Tensor([1 2 3], shape=(3,), dtype=int32)
# minimum of x2: tf.Tensor(1, shape=(), dtype=int32)
# maxmum of x2: tf.Tensor(3, shape=(), dtype=int32)
在一个二维张量中,可以通过调整axis为0或1控制执行维度
axis=0表示跨行(沿经度方向,dowm)
axis=1表示跨列(沿纬度方向,across)
如果不指定axis,则所有元素参与计算
计算张量沿着指定维度的和(平均值)
tf.reduce_mean(张量名,axis=操作轴)
tf.reduce_sum(张量名,axis=操作轴)
import tensorflow as tf
x = tf.constant([[1, 2, 3], [2, 2, 3]])
print("x:", x)
print("mean of x:", tf.reduce_mean(x)) # 求x中所有数的均值
print("sum of x:", tf.reduce_sum(x, axis=1)) # 求每一行的和
# x: tf.Tensor(
# [[1 2 3]
# [2 2 3]], shape=(2, 3), dtype=int32)
# mean of x: tf.Tensor(2, shape=(), dtype=int32)
# sum of x: tf.Tensor([6 7], shape=(2,), dtype=int32)
将变量标记为“可训练”
tf.Variable(初始值)
被标记的变量会在反向传播中记录梯度信息。神经网络训练中,常用该函数标记待训练参数
数学运算
四则运算
加:tf.add
减:tf.subtract
乘:tf.multiply
除:tf.divide
只有维度相同的向量才可以四则运算
import tensorflow as tf
a = tf.ones([1, 3])
b = tf.fill([1, 3], 3.)
print("a:", a)
print("b:", b)
print("a+b:", tf.add(a, b))
print("a-b:", tf.subtract(a, b))
print("a*b:", tf.multiply(a, b))
print("b/a:", tf.divide(b, a))
# a: tf.Tensor([[1. 1. 1.]], shape=(1, 3), dtype=float32)
# b: tf.Tensor([[3. 3. 3.]], shape=(1, 3), dtype=float32)
# a+b: tf.Tensor([[4. 4. 4.]], shape=(1, 3), dtype=float32)
# a-b: tf.Tensor([[-2. -2. -2.]], shape=(1, 3), dtype=float32)
# a*b: tf.Tensor([[3. 3. 3.]], shape=(1, 3), dtype=float32)
# b/a: tf.Tensor([[3. 3. 3.]], shape=(1, 3), dtype=float32)
平方,次方,开方
tf.square(张量名)
tf.pow(张量名,次方数)
tf.sqrt(张量名)
import tensorflow as tf
a = tf.fill([1, 2], 3.)
print("a:", a)
print("a的平方:", tf.pow(a, 3))
print("a的平方:", tf.square(a))
print("a的开方:", tf.sqrt(a))
# a: tf.Tensor([[3. 3.]], shape=(1, 2), dtype=float32)
# a的平方: tf.Tensor([[27. 27.]], shape=(1, 2), dtype=float32)
# a的平方: tf.Tensor([[9. 9.]], shape=(1, 2), dtype=float32)
# a的开方: tf.Tensor([[1.7320508 1.7320508]], shape=(1, 2), dtype=float32)
矩阵乘法
tf.matmul(矩阵a, 矩阵b)
import tensorflow as tf
a = tf.ones([3, 2])
b = tf.fill([2, 3], 3.)
print("a*b:", tf.matmul(a, b))
# a*b: tf.Tensor(
# [[6. 6. 6.]
# [6. 6. 6.]
# [6. 6. 6.]], shape=(3, 3), dtype=float32)
特征和标签配对函数
切分传入张量的第一维度,生成输入特征/标签对,构建数据集
tf.data.Dataset.from_tensor_slices((输入特征,标签))
对numpy和tensor格式都适用
import tensorflow as tf
features = tf.constant([12, 23, 10, 17])
labels = tf.constant([0, 1, 1, 0])
dataset = tf.data.Dataset.from_tensor_slices((features, labels))
for element in dataset:
print(element)
# (<tf.Tensor: shape=(), dtype=int32, numpy=12>, <tf.Tensor: shape=(), dtype=int32, numpy=0>)
# (<tf.Tensor: shape=(), dtype=int32, numpy=23>, <tf.Tensor: shape=(), dtype=int32, numpy=1>)
# (<tf.Tensor: shape=(), dtype=int32, numpy=10>, <tf.Tensor: shape=(), dtype=int32, numpy=1>)
# (<tf.Tensor: shape=(), dtype=int32, numpy=17>, <tf.Tensor: shape=(), dtype=int32, numpy=0>)
某个函数对指定参数的求导运算
tf.GradientTape
with记录计算过程,gradient求出张量的梯度
with tf.GraddientTape() as Tape:
计算过程
grad=tape.gradient(函数,对谁求导)
import tensorflow as tf
with tf.GradientTape() as tape:
x = tf.Variable(tf.constant(3.0))
y = tf.pow(x, 2)
grad = tape.gradient(y, x)
print(grad)
# tf.Tensor(6.0, shape=(), dtype=float32)
# 损失函数为w²,对w求导为2w,w=3.0代入得结果6.0
枚举所有元素并配上对应的索引号
enumerate(列表名)
seq = ['one', 'two', 'three']
for i, element in enumerate(seq):
print(i, element)
# 0 one
# 1 two
# 2 three
将待转换的数据转换为独热编码
1表示是,0表示非
tf.one_hot(待转换数据,depth=几分类)
import tensorflow as tf
classes = 3
labels = tf.constant([1, 0, 2]) # 输入的元素值最小为0,最大为2
output = tf.one_hot(labels, depth=classes)
print("result of labels1:", output)
# result of labels1: tf.Tensor(
# [[0. 1. 0.]
# [1. 0. 0.]
# [0. 0. 1.]], shape=(3, 3), dtype=float32)
Softmax损失函数:使多分类的输出符合概率分布,便于使用独热码
其中,Vi 是分类器前级输出单元的输出。i 表示类别索引,总的类别个数为 C。Si 表示的是当前元素的指数与所有元素指数和的比值。
import tensorflow as tf
y = tf.constant([1.01, 2.01, -0.66])
y_pro = tf.nn.softmax(y)
print("After softmax, y_pro is:", y_pro) # y_pro 符合概率分布
print("The sum of y_pro:", tf.reduce_sum(y_pro)) # 通过softmax后,所有概率加起来和为1
# After softmax, y_pro is: tf.Tensor([0.25598174 0.69583046 0.0481878 ], shape=(3,), dtype=float32)
# The sum of y_pro: tf.Tensor(1.0, shape=(), dtype=float32)
更新参数的值并返回
w.assign_sub(w要自减的内容)
(前提是被更新的w要先被tf.Varialbe指定为可训练)
import tensorflow as tf
x = tf.Variable(4)
x.assign_sub(1)
print("x:", x)
# 4-1=3
# x: <tf.Variable 'Variable:0' shape=() dtype=int32, numpy=3>
返回指定操作轴方向最大值的索引
tf.argmax(张量名,axis=操作轴)
axis为1时表示列,0为行
import numpy as np
import tensorflow as tf
test = np.array([[1, 2, 3], [2, 3, 4], [5, 4, 3], [8, 7, 2]])
print("test:\n", test)
print("每一列的最大值的索引:", tf.argmax(test, axis=0)) # 返回每一列最大值的索引
print("每一行的最大值的索引", tf.argmax(test, axis=1)) # 返回每一行最大值的索引
# test:
# [[1 2 3]
# [2 3 4]
# [5 4 3]
# [8 7 2]]
# 每一列的最大值的索引: tf.Tensor([3 3 1], shape=(3,), dtype=int64)
# 每一行的最大值的索引 tf.Tensor([2 2 0 0], shape=(4,), dtype=int64)
转载:https://blog.csdn.net/weixin_43665201/article/details/106180335