Main Navigation ai搭建前端 agent 主页

Appearance

Sidebar Navigation

过往

preface

LLM

食用手册

preface

工具(库)

PyTorch

TensorFlow

基础网络组件

嵌入层 Embedding层

激活函数

预训练模型

图像分割模型

UNet

跨模态预训练模型

CLIP

预训练语言模型

BERT

LLM

预训练语言模型（Pre-trained Language Models, PLMs）

架构

全连接神经网络FCNN

循环神经网络RNN

卷积接神经网络CNN

隐式马尔可夫模型HMM（声学模型）

model应用

AIGC（人工智能生成内容）

扩散家族

stable duffusion

扩散模型DDPM（deosising diffusion probabilistic models）

生成对抗网络GAN

Logistic回归

SVM支持向量机

Transformer

外部组件

RAG

高斯噪声

diary

preface

近期出现的事情

project

preface

dify售后机器人

overleaf

论文写作

question

preface

graph

list

py面向对象

setdefault

字符串

并查集

并行计算

数据结构和算法pormax

枚举 and 拉链

矩阵

范数

tool

preface

Playwright CLI vs Playwright MCP

conda

docker

git

hugging

jupyter手册

mysql

python之禅

uv 和 conda 的并行

On this page

LLM

LLM(如Qwen)的Embedding生成原理: 模型结构: 基于Transformer解码器，使用单向自注意力(仅关注左侧上下文) 预训练任务: 自回归语言建模(预测下一个token)。

Embedding来源: 通常取最后一层所有token的隐藏状态，或最后一个token的隐藏状态作为序列表示(需根据任务调整)

Pager

Previous pageBERT

Next page预训练语言模型（Pre-trained Language Models, PLMs）

图像分割模型

跨模态预训练模型

预训练语言模型

AIGC（人工智能生成内容）

扩散家族

LLM ​

LLM