小言_互联网的博客

TensorFlow2.1入门笔记1

389人阅读  评论(0)

基础知识

张量(Tensor):多维数组(列表) 阶:张量的维数

0阶张量表示标量,例:a=1 2 3
1阶张量表示向量(一维数组),例:a=[1,2,3]
2阶张量表示矩阵(二维数组)可以有i行j列,每个元素可以用行号和列号共同索引到,例:a=[[1,2,3],[4,5,6],[7,8,9]]
判断张量是几阶的,看t=[[[[[…的括号有多少个
张量表示0阶到n阶的数组

TensorFlow的数据类型

tf.int,tf.float

tf.int32,tf.float32,tf.float64

tf.bool
tf.string

如何创建一个Tensor

直接创建

tf.constant(张量内容,dtype=数据类型(可选,本机默认是tf.int32))
例:

import tensorflow as tf

a = tf.constant([1, 5], dtype=tf.int64)
print("a:", a)
print("a.dtype:", a.dtype)
#运行结果
#a: tf.Tensor([1 5], shape=(2,), dtype=int64)
#a.dtype: <dtype: 'int64'>
#a.shape: (2,)

将numpy的数据类型转换为Tensor

tf.convert_to_tensor(数据名,dtype=数据类型(可选,本机默认是tf.int32))

import tensorflow as tf
import numpy as np

a = np.arange(0, 5)
b = tf.convert_to_tensor(a, dtype=tf.int64)
print("a:", a)
print("b:", b)
#运行结果:
# a: [0 1 2 3 4]
# # b: tf.Tensor([0 1 2 3 4], shape=(5,), dtype=int64)

创建全为某个值的张量:

全为0:tf.zeros(维度)
全为1:tf.ones(维度)
维度:一维直接写个数,二维[行,列],多维[n,m,j,k…]
全为指定值的张量:tf.fill(维度,指定值)

import tensorflow as tf

a = tf.zeros([2, 3])
b = tf.ones(4)
c = tf.fill([2, 2], 9)
print("a:", a)
print("b:", b)
print("c:", c)
#运行结果
# a: tf.Tensor([[0. 0. 0.][0. 0. 0.]], shape=(2, 3), dtype=float32)
# b: tf.Tensor([1. 1. 1. 1.], shape=(4,), dtype=float32)
# c: tf.Tensor([[9 9][9 9]], shape=(2, 2), dtype=int32)

生成指定维度符合正态分布的张量

tf.random.normal(维度,mean=均值,stddev=标准差)(默认mean=0,stddev=1)
要想数据更加集中可以生成截断式正态分布的随机数:
tf.random.truncated_normal(维度,mean=均值,stddev=标准差)
可以让数据在(μ-2σ,μ+2σ)间

import tensorflow as tf

d = tf.random.normal([2, 2], mean=0.5, stddev=1)
print("d:", d)
e = tf.random.truncated_normal([2, 2], mean=0.5, stddev=1)
print("e:", e)
# 运行结果可见第二种方法数据更向0.5集中
# d: tf.Tensor(
# [[-1.4998953e+00  7.1462959e-01]
#  [-1.0406375e-03  6.1626345e-01]], shape=(2, 2), dtype=float32)
# e: tf.Tensor(
# [[-0.7189257  -0.77654326]
#  [ 1.2663629   1.0182645 ]], shape=(2, 2), dtype=float32)

生成均匀分布的随机数

tf.random.uniform(维度,minval,maxval)

import tensorflow as tf

f = tf.random.uniform([2, 2], minval=0, maxval=1)
print("f:", f)

# f: tf.Tensor(
# [[0.21811843 0.3118713 ]
#  [0.2081083  0.52303874]], shape=(2, 2), dtype=float32)

常用函数

强制类型转换:

tf.cast(张量名,dtype=数据类型)

计算张量维度上元素的最大(小)值

tf.reduce_max(张量名)
tf.reduce_min(张量名)

import tensorflow as tf

x1 = tf.constant([1., 2., 3.], dtype=tf.float64)
print("x1:", x1)
x2 = tf.cast(x1, tf.int32)
print("x2", x2)
print("minimum of x2:", tf.reduce_min(x2))
print("maxmum of x2:", tf.reduce_max(x2))

# x1: tf.Tensor([1. 2. 3.], shape=(3,), dtype=float64)
# x2 tf.Tensor([1 2 3], shape=(3,), dtype=int32)
# minimum of x2: tf.Tensor(1, shape=(), dtype=int32)
# maxmum of x2: tf.Tensor(3, shape=(), dtype=int32)

在一个二维张量中,可以通过调整axis为0或1控制执行维度
axis=0表示跨行(沿经度方向,dowm)
axis=1表示跨列(沿纬度方向,across)
如果不指定axis,则所有元素参与计算

计算张量沿着指定维度的和(平均值)

tf.reduce_mean(张量名,axis=操作轴)
tf.reduce_sum(张量名,axis=操作轴)

import tensorflow as tf

x = tf.constant([[1, 2, 3], [2, 2, 3]])
print("x:", x)
print("mean of x:", tf.reduce_mean(x))  # 求x中所有数的均值
print("sum of x:", tf.reduce_sum(x, axis=1))  # 求每一行的和

# x: tf.Tensor(
# [[1 2 3]
#  [2 2 3]], shape=(2, 3), dtype=int32)
# mean of x: tf.Tensor(2, shape=(), dtype=int32)
# sum of x: tf.Tensor([6 7], shape=(2,), dtype=int32)

将变量标记为“可训练”

tf.Variable(初始值)
被标记的变量会在反向传播中记录梯度信息。神经网络训练中,常用该函数标记待训练参数

数学运算

四则运算
加:tf.add
减:tf.subtract
乘:tf.multiply
除:tf.divide
只有维度相同的向量才可以四则运算

import tensorflow as tf

a = tf.ones([1, 3])
b = tf.fill([1, 3], 3.)
print("a:", a)
print("b:", b)
print("a+b:", tf.add(a, b))
print("a-b:", tf.subtract(a, b))
print("a*b:", tf.multiply(a, b))
print("b/a:", tf.divide(b, a))

# a: tf.Tensor([[1. 1. 1.]], shape=(1, 3), dtype=float32)
# b: tf.Tensor([[3. 3. 3.]], shape=(1, 3), dtype=float32)
# a+b: tf.Tensor([[4. 4. 4.]], shape=(1, 3), dtype=float32)
# a-b: tf.Tensor([[-2. -2. -2.]], shape=(1, 3), dtype=float32)
# a*b: tf.Tensor([[3. 3. 3.]], shape=(1, 3), dtype=float32)
# b/a: tf.Tensor([[3. 3. 3.]], shape=(1, 3), dtype=float32)

平方,次方,开方
tf.square(张量名)
tf.pow(张量名,次方数)
tf.sqrt(张量名)

import tensorflow as tf

a = tf.fill([1, 2], 3.)
print("a:", a)
print("a的平方:", tf.pow(a, 3))
print("a的平方:", tf.square(a))
print("a的开方:", tf.sqrt(a))

# a: tf.Tensor([[3. 3.]], shape=(1, 2), dtype=float32)
# a的平方: tf.Tensor([[27. 27.]], shape=(1, 2), dtype=float32)
# a的平方: tf.Tensor([[9. 9.]], shape=(1, 2), dtype=float32)
# a的开方: tf.Tensor([[1.7320508 1.7320508]], shape=(1, 2), dtype=float32)

矩阵乘法
tf.matmul(矩阵a, 矩阵b)

import tensorflow as tf

a = tf.ones([3, 2])
b = tf.fill([2, 3], 3.)

print("a*b:", tf.matmul(a, b))

# a*b: tf.Tensor(
# [[6. 6. 6.]
#  [6. 6. 6.]
#  [6. 6. 6.]], shape=(3, 3), dtype=float32)

特征和标签配对函数

切分传入张量的第一维度,生成输入特征/标签对,构建数据集
tf.data.Dataset.from_tensor_slices((输入特征,标签))
对numpy和tensor格式都适用

import tensorflow as tf

features = tf.constant([12, 23, 10, 17])
labels = tf.constant([0, 1, 1, 0])
dataset = tf.data.Dataset.from_tensor_slices((features, labels))
for element in dataset:
    print(element)
    
# (<tf.Tensor: shape=(), dtype=int32, numpy=12>, <tf.Tensor: shape=(), dtype=int32, numpy=0>)
# (<tf.Tensor: shape=(), dtype=int32, numpy=23>, <tf.Tensor: shape=(), dtype=int32, numpy=1>)
# (<tf.Tensor: shape=(), dtype=int32, numpy=10>, <tf.Tensor: shape=(), dtype=int32, numpy=1>)
# (<tf.Tensor: shape=(), dtype=int32, numpy=17>, <tf.Tensor: shape=(), dtype=int32, numpy=0>)

某个函数对指定参数的求导运算

tf.GradientTape
with记录计算过程,gradient求出张量的梯度
with tf.GraddientTape() as Tape:
计算过程
grad=tape.gradient(函数,对谁求导)

import tensorflow as tf

with tf.GradientTape() as tape:
    x = tf.Variable(tf.constant(3.0))
    y = tf.pow(x, 2)
grad = tape.gradient(y, x)
print(grad)

# tf.Tensor(6.0, shape=(), dtype=float32)
# 损失函数为w²,对w求导为2w,w=3.0代入得结果6.0

枚举所有元素并配上对应的索引号

enumerate(列表名)

seq = ['one', 'two', 'three']
for i, element in enumerate(seq):
    print(i, element)
    
# 0 one
# 1 two
# 2 three

将待转换的数据转换为独热编码

1表示是,0表示非
tf.one_hot(待转换数据,depth=几分类)

import tensorflow as tf

classes = 3
labels = tf.constant([1, 0, 2])  # 输入的元素值最小为0,最大为2
output = tf.one_hot(labels, depth=classes)
print("result of labels1:", output)

# result of labels1: tf.Tensor(
# [[0. 1. 0.]
#  [1. 0. 0.]
#  [0. 0. 1.]], shape=(3, 3), dtype=float32)

Softmax损失函数:使多分类的输出符合概率分布,便于使用独热码


其中,Vi 是分类器前级输出单元的输出。i 表示类别索引,总的类别个数为 C。Si 表示的是当前元素的指数与所有元素指数和的比值。

import tensorflow as tf

y = tf.constant([1.01, 2.01, -0.66])
y_pro = tf.nn.softmax(y)

print("After softmax, y_pro is:", y_pro)  # y_pro 符合概率分布

print("The sum of y_pro:", tf.reduce_sum(y_pro))  # 通过softmax后,所有概率加起来和为1

# After softmax, y_pro is: tf.Tensor([0.25598174 0.69583046 0.0481878 ], shape=(3,), dtype=float32)
# The sum of y_pro: tf.Tensor(1.0, shape=(), dtype=float32)

更新参数的值并返回

w.assign_sub(w要自减的内容)
(前提是被更新的w要先被tf.Varialbe指定为可训练)

import tensorflow as tf

x = tf.Variable(4)
x.assign_sub(1)
print("x:", x)  

# 4-1=3
# x: <tf.Variable 'Variable:0' shape=() dtype=int32, numpy=3>

返回指定操作轴方向最大值的索引

tf.argmax(张量名,axis=操作轴)
axis为1时表示列,0为行

import numpy as np
import tensorflow as tf

test = np.array([[1, 2, 3], [2, 3, 4], [5, 4, 3], [8, 7, 2]])
print("test:\n", test)
print("每一列的最大值的索引:", tf.argmax(test, axis=0))  # 返回每一列最大值的索引
print("每一行的最大值的索引", tf.argmax(test, axis=1))  # 返回每一行最大值的索引

# test:
#  [[1 2 3]
#  [2 3 4]
#  [5 4 3]
#  [8 7 2]]
# 每一列的最大值的索引: tf.Tensor([3 3 1], shape=(3,), dtype=int64)
# 每一行的最大值的索引 tf.Tensor([2 2 0 0], shape=(4,), dtype=int64)

转载:https://blog.csdn.net/weixin_43665201/article/details/106180335
查看评论
* 以上用户言论只代表其个人观点,不代表本网站的观点或立场