《旭创人》第七期

发布时间:2024-2-04 | 杂志分类:其他
免费制作
更多内容

《旭创人》第七期

视界VIEWS多种技能。 更短的功能发布时间:为一项新技能建立一个新管道所需的时间通常比对 LLM 进行 p 调谐所需要的时间更长(稍后将对此进行详细介绍)。这意味着 TTM 要长得多。 数据采集和质量维护:任何专门构建的集合都需要大量的特定病例数据,而这些数据并不总是可用的。必须在每个模型的基础上收集这些数据。换句话说,除了来自集成的 I / O 之外,还需要用于集成中使用的每个单独模型的数据集。此外,所有模型都会随着时间的推移而漂移,在使用多个模型时,用于微调的维护成本会迅速增加。这些考虑因素显示了在多个系综上使用 LLM 的价值。聊天机器人通常是由一组 BERT 模型和一个对话框管理器构建的。这种方法具有一些优点,例如更小的模型,这可以降低延迟和计算需求。这反过来又更具成本效益。那么,为什么不使用合奏而不是 LLM 呢? 就其设计而言,合奏团不如 LLM 灵活。这种灵活性来自生成能力,以及所述模型是在需要各种任务的大型数据语料库上训练的。 在许多情况下,获得足够的数据来应对挑战是不可行的。 每个集合都有自己的 MLOps 管道。维护和更新大量复杂的合奏是困难的,因为每个合奏中的每... [收起]
[展开]
《旭创人》第七期
粉丝: {{bookData.followerCount}}
文本内容
第51页

视界

VIEWS

多种技能。

更短的功能发布时间:

为一项新技能建立一个新管道所需的时间通常

比对 LLM 进行 p 调谐所需要的时间更长(稍后将对

此进行详细介绍)。这意味着 TTM 要长得多。

数据采集和质量维护:

任何专门构建的集合都需要大量的特定病例数

据,而这些数据并不总是可用的。必须在每个模型的

基础上收集这些数据。换句话说,除了来自集成的 I /

O 之外,还需要用于集成中使用的每个单独模型的

数据集。此外,所有模型都会随着时间的推移而漂

移,在使用多个模型时,用于微调的维护成本会迅速

增加。

这些考虑因素显示了在多个系综上使用 LLM

的价值。

聊天机器人通常是由一组 BERT 模型和一个

对话框管理器构建的。这种方法具有一些优点,例如

更小的模型,这可以降低延迟和计算需求。这反过来

又更具成本效益。那么,为什么不使用合奏而不是

LLM 呢?

就其设计而言,合奏团不如 LLM 灵活。这种灵

活性来自生成能力,以及所述模型是在需要各种任

务的大型数据语料库上训练的。

在许多情况下,获得足够的数据来应对挑战是

不可行的。

每个集合都有自己的 MLOps 管道。维护和更

新大量复杂的合奏是困难的,因为每个合奏中的每

个模型都必须定 期进行微调。

虽然像 BERT 这样的语言模型已经被有效地用

于处理文本分类等许多下游任务,但已经观察到,随

着这些模型规模的增加,某些额外的能力也会出现。

这种规模的增加通常伴随着以下三个维度的相

应增加:参数的数量、训练数据和训练模型所需的

计 算 资 源。有 关 详 细 信 息,请 参 阅 Emergent

Abilities of Large Language Models。

LLM 是一种深度学习模型,可以使用大型数据

集识别、总结、翻译、预测和生成内容。 LLM 没有一

个集合的界限,但为了本讨论的目的,我们使用这个

术语来指代任何 GPT 规模的模型或具有 1B 或更多

参数的模。

这篇文章解释了在使用较小语言模型构建的一

组模型管道上使用 LLM 的好处。它还涵盖了以下基

本内容:

LLM 提示

快速工程

P- 调谐

为什么要使用大型语言模型? 提示被用作与 LLM 交互以完成任务的一种手

段。提示是用户提供的输入,模型要对其做出响应。

提示可以包括说明、问题或任何其他类型的输入,具

体取决于模型的预期用途。例如,在稳定扩散模型的

情况下,提示是要生成的图像的描述,提示也可以采

用图像的形式。通过这种方法,生成的文本输出描述

了图像提示。这通常用于图像字幕等任务。

对于 GPT-3 等模型,文本提示可以是一个简单

的问题,比如“彩虹中有多少种颜色?”或者,提示可

以采取复杂问题、数据或指令的形式,比如“写一首

励志诗,让我快乐。”

提示还可以包括特定的约束或要求,如语气、风

格,甚至所需的响应长度。例如,给朋友写信的提示

可以指定语气、字数限制和要包含的特定主题。

LLM 生成的响应的质量和相关性在很大程度上

取决于提示的质量。因此,提示在自定义 LLM 以确

保模型的响应满足自定义用例的要求方面发挥着关

键作用。

提示 LLM

术语快速工程是指仔细设计提示以生成特定输

出的过程。提示在从模型中获得最佳结果方面发挥

着关键作用,而如何编写提示可以对生成的输出产

提示工程以获得更好的提示

可以说,一组模型可以比 LLM 便宜。然而,仅考

虑推理成本,这一假设忽略了以下考虑因素:

节省工程时间和成本:

构建、维护和扩展集成是一项复杂的挑战。每个

组件模型都必须进行微调。用于模型推理和缩放以

适应流量的人工智能基础设施需要相当多的时间来

构建。这是针对一项技能。为了模仿 LLM ,必须建立

LLM 在多个系综中的价值

图 3 :DALL-E 2 文本提示(左)和生成的图像(右) 图 4 :图像提示(左)和生成的文本(右)

48

第52页

这篇文章讨论了 LLM ,并概述了它们的使用案

例。它还涵盖了定制 LLM 行为所涉及的基本概念,

包括各种类型的提示、提示工程和 p 调整。

视界

VIEWS

可以使用少量示例,从而限制控制级别

示例必须预先附加,这会影响代币预算

如何绕过这些限制?

迁移学习是一个明显的候选者:从一个基本模

型开始,使用特定于用例的数据来微调模型。这种方

法在处理常规模型时效果很好,但微调具有 530B 参

数的模型(比 BERT 模型大约 5300 倍)会消耗相当

大的时间和资源 P- 调谐,或迅速调谐 , 是一种参数

有效的调整技术,可以解决这一挑战 .P- 调谐包括在

使用 LLM 之前使用一个小的可训练模型。小模型用

于对文本提示进行编码,并生成特定于任务的虚拟

令牌。

这 些 虚 拟 令 牌 被 预 先 附 加 到 提 示 并 传 递 给

LLM 。当调优过程完成时,这些虚拟令牌被存储在查

找表中,并在推理过程中使用,取代较小的模型。

这一过程是有益的,原因如下:

与微调 LLM 相比,定制模型管道以获得所需

结果所需的资源要少得多

调整较小型号所需的时间要少得多(最快可达

约 20 分钟)

在不需要大量内存的情况下,可以保存对不同

任务进行 p 调整的模型

这个NVIDIA NeMo 云服务简化了这个过程。有

关详细信息,请参阅 p-tuning the models in the

NeMo service(您必须是早期访问计划的成员)。

如前所述,即时工程是定制模型响应的一种方

法。然而,这种方法有缺点:

生很大影响。以下示例讨论了三种不同的策略:

零样本提示

很少提示射击

思维链提示

零样本意味着提示模型,而不显示任何来自模

型的预期行为示例。例如,一个零样本提示会提出一

个问题。

在图 7 中,答案是错误的,因为巴黎是首都。从

答案来看,模型可能不理解“资本”一词在这种情况下

的使用。

克服这个问题的一个简单方法是在提示中给出

一些例子。这种类型的提示被称为少镜头提示。在提

出实际问题之前,您提供了几个例子。

几次射击提示使模型能够在没有训练的情况下

进行学习。这是设计提示的一种方法。

你如何让模型合乎逻辑地回答一个问题?要了

解这一点,请从更复杂的零样本提示开始。

在图 9 中,答案再次出现错误。(正确答案是四

个蓝色高尔夫球。)为了帮助发展推理,请使用一种

名为思维链提示。通过提供一些镜头示例来做到这

一点,其中解释了推理过程。当 LLM 回答提示时,它

也会显示其推理过程。

虽然图 10 中所示的示例是一个“思考链”提示,

但您也可以给出一个“零样本链”提示。这种类型的提

示包括诸如 “让我们从逻辑上思考这个问题” 之类的

短语通过这种方法, LLM 生成了一个能够准确回答

问题的思想链。尝试一系列不同的提示是很有用的。

图 5:不同类型提示的示例:简单、复杂和说明

P- 调整以自定义 LLM

结论

49

第53页

本文来源:https://developer.nvidia.com/zh-cn/blog/an-introduction-to-large-language-models-prompt-engineering-and-p-tuning/

视界

VIEWS

图 7:一个简单的问题是零样本提示的示例

图 9:一个复杂的逻辑问题零样本提示

图 10:几个镜头的思维链提示示例,使 LLM 能够通过推理准确回答

图 11:零样本思维链提示,使 LLM 能够通过推理准确回答

图 8:几个镜头提示的示例问题

图 12:即时调谐的一般流程

50

第54页

随感

Impression 而今大成。不固执不坚定不足以成老 W,冷峻,理性,

酒也浇不化的理性。

18 年 M 那句 “把自己保护得好好的,于项目何

益呢?”音犹在耳;

我首登讲台的那次,紧张得什么似的。H 哥是款

款地走进培训室的,而后有种安定弥散;

O 一句“天佑旭创”是动力之源。

GUYU 说话总结束以羞赧的笑,言犹未尽似的。

诚诚恳恳的总是讷于言辞。

再早的清晨,再深的夜总能在工作群里听到波

仔的进度报告。现在回想起来,我读他的文字脑子里

是有他的口音的。

自诩好记性,常对人复述电影情节,诵书中精

妙的句子。习惯性地注目一些人,倘有什么触动,则

记忆深刻。

旭创十五年,自己入职也已十年,遇见的人,事

颇多;过往经历,像悠悠的河:时而柔沙细浪,时而

怒涛奔腾;有时鱼龙潜跃,有时月宛江心 ; 每每静下

来,哪些情境也能清晰忆起:

16 年首提 icord 概念,果决一句必见成,必见效,

文/RD 方习贵

你好,旭创人

HELLO INNOLIGHT

你好, 旭创人

Hello, InnoLight

51

第55页

SUNNY 是晴好的意思,永远微笑着,曾在海边

拍下她阳光洒在脸上的照片以报她护我美国初行周

全。22 年底述职结束语“行则将至”,深以为然。

足球场上狂野的熊BEAR, 在什么比赛中总是

赢,小龙虾乐队,龙舟大赛也是。幽默,油,透着真诚。

奉“竹杖芒鞋轻胜马,一蓑烟雨任平生”为圭臬。

除非在班车上,地铁口,否则难得一见。李博士

是谜之 X 博士。

卫斯理,书生气江湖气兼而有之。讲话做事慢条

斯理,不愠不怒,故名。饮酒豪迈不羁,筷子开瓶,一

饮而尽…

LYNN CEG 新同伴,一双凤目忽闪忽闪。年轻,

气静。

DON 是篮球场上左闪右突的魅影,拥有最长的

项目完成清单。二度球场受伤,对什么都认真,拼尽

全力。

JESPER 涉猎甚多,很多技能无师自通,说技

术总是兴致勃勃。我举起相机对准,他就抿口笑 ,

剪刀手…

凡此种种,往日情境一幕幕接踵而至,不胜枚

举。人陷入回忆时心静极了,老鹰在天上飞的时候,

有一刻是不动的…

J 其依据性格色彩学知识卜定我是属灰色的,旁

观色,静静的地观察着周遭,细细地感受。须要叹服

其洞察。确实如此,抑或每个人总会在某时静静看

着,细细品味着其他人呢。毕竟是十五年,哪个瞬间

你又被谁触动了呢?

《木心诗选》书封上有句“哪有你这样好,哪有你

这样你…..”

你好,旭创人

HELLO INNOLIGHT

52

第56页

旅途

Journey

“人有悲欢离合,月有阴晴圆缺”正如苏

轼先生所写,人生在世,难免分分合合,为了

各自的事业,各自的奋斗目标而勇往直前。也

许,下一次相见是为了遇见更好的自己,但请

不要忘记,人生也是一趟单程票,在有限的时

间里面去和所爱的人相知相守,相伴不易,久

伴不弃;常伴父母身边,陪他们聊聊家常,关

心他们的身体;多陪陪需要长大的孩子,在

成长的路上帮孩子树立人生目标;挚友高朋

满座,侃侃而谈,天南海北的分享着自己的所

见所闻;相聚或者相离,情景不同,旅途中的

感受也不尽相同。

“千锤万凿出深山,烈火焚烧若等闲”亦

如于谦先生所说,人生中在所难免会遇到挫

折与困难,哪怕道路险阻,哪怕困难重重,只

有坚定初心,不懈努力,才有可能达到胜利的

彼岸。就像历经九九八十一难的唐僧师徒,不

畏困难,勇往直前,最终修成正果,取得真经,

也为后世留的佳话,成为不屈不挠的典范。相

反三国时期蜀汉君主刘婵,虽有名相诸葛亮

的辅佐,但自身对政治军事毫无建树,在诸葛

亮去世之后,在仍有一战之力的情况下,将百

年基业送给曹氏,并衍生了乐不思蜀的典故,

让人为之叹息。挫折与困难在生活中在所难

免,选择不同,旅途中的体验也不尽相同。

“路漫漫其修远兮,吾将上下而求索”诚

如屈原先生所讲,在漫长的人生岁月中,只

有不断探索,学无止境,人生才会变得丰富

多彩。就像牙牙学语的孩子,父母不厌其烦

一遍遍的引导,使其在人生的路上奠定了基

础;又像课堂上孜孜不倦读书的学生,辛勤

的园丁一遍又一遍的播撒着自己的知识,让

祖国的花朵茁长成长;还像我国科研工作

者,为了祖国和全人类的进步,努力攻克一

个个难关,奋斗不止。就像美国航天员尼尔

阿姆斯特朗说“我的一小步,人类的一大步”

全人类为了这个共同目标而努力,生生不

息。学无止境,自强不息的高度不同,在旅途

中的乐趣也不尽相同。

人生就是一场旅途,或许充满了未知

与挑战,或许也充满了鲜花和掌声,但我认

为我们在乎的不应该是目的地,而是这沿途

的风景,荒漠戈壁亦或绿洲平原,这些都会

成为我们丰富人生的一部分,勇敢且无畏,

岂不乐哉!岂不美哉!

你好,旭创人

HELLO INNOLIGHT

文/重庆君歌电子

韩树新

人生就像一场多

彩的旅途,迸发着它

绚丽的色彩,让人心

驰神往。

53

第57页

你好,旭创人

HELLO INNOLIGHT

精彩瞬间

Wonderful Moments

2023 喜迎红色中国年,穿上唐装,祈运前程

01

01

端午浓情,粽叶飘香,一起来包粽子!

02

02

君到姑苏见,人家尽枕河,泰国员工来苏感受江南水乡的诗情画意

03

03

新加坡小分队的帅气 pose

04

04

2023 年旭创科技家庭日,大小朋友们都笑容满面

05

05

54

第58页

你好,旭创人

HELLO INNOLIGHT

爱心义卖,与爱同行

07

07

暑托班开班啦,相伴成长,快乐一夏

06

06

在爱心市集,汇聚点滴爱意,为乡村儿童教育奉献一份力量

08

向荣六周年爱心家宴,一路繁花,向心生长

09

09

烤肉联欢会,开心就一起比心

10

10

今年绿茵草地见证一场场酣畅淋漓的球赛

11

11

08

55

第59页

你好,旭创人

HELLO INNOLIGHT

全员健身挑战赛,坚持就是胜利

12

12

Let's celebrate the 1st Shipment Ceremony !

13

13

创芯班开班,用芯能量开启光之未来

14

14

旭创十五周年,热情不褪色!

16

16

铜陵五周年,我们一直在一起

15

15

56

第60页

结晶

QUINTESSENCE

结晶

Quintessence

57

第61页

文/RD 袁雪平

结晶

QUINTESSENCE

降本改进-400G/800G

BERT子母板开发

开发团队:RD高频组,机构组,layout组,软件组,MFG单模模块制程组

用自研 BERT 板的小伙伴,有没有碰到这样的尴尬

1. BERT 板烧录失败

2. 初始化失败

3. 通信不上

4.connector 性能不良,BERT 板报废

5. 坏的 BERT 板被人扔一边,自己不知道继续用,成功入坑

由于研发,测试都要用到 BERT 板,随着 400G/800G 模块大量出货,这些 BERT 板的损耗速度相当可观,

而且 BERT 板失效,会给研发,制造带来工时的损耗,比如研发要花时间诊断测试环境哪里出了问题,制造会测

到异常数据,要花时间找原因,复测。

为了优化当前自研 BERT 板 ( 下文称为 BERT 正常板 ),RD 高频组,机构组,layout 组,软件组,MFG 单模

模块制程组的小伙伴们合作开发了 400G/800G BERT 子母板,它们在成本,可靠性,比 BERT 正常板,有绝对

优势。

开发的难点在于:

1. 结构风险,因为要适配现有 ATS 及 TEC 机台。开发过程中,由于结构不匹配,BERT 子母板还改过两版

2. 高频连接器选型,要求成本低,可靠性高

3. 高频性能风险,因为增加一对高频连接器,插损增加,眼图有严重劣化的风险

4. 软件开发,为了增加 BERT 板可靠性,去掉了板上的 2 个 Mcu,BERT 板烧录软件要重新开发

一、背景

1. 4 个高频头,单价贵

2. DSP 散热器,单价贵

3. 采用 2 个 Mcu

4. 采用 5 个电源输入连接器

5. 采用 2 个 EEPROM

6. 采用 2 路 156MHz 时钟

7. 板上保留了生产用不上的 TP、电压转换芯片、开关

最关键的:Connector 使用寿命:平均模块插拔 1 次花费 0.6 元

二、当前 BERT 正常板的缺陷

痛点 1—成本高

58

第62页

结晶

QUINTESSENCE

三、BERT 子母板做的改进

1. 4 个高频头,单价贵

2. DSP 散热器,单价贵

3. 采用 2 个 Mcu

4. 采用 5 个电源输入连接器

5. 采用 2 个 EEPROM

6. 采用 2 路 156MHz 时钟

7. 板上保留了生产用不上的 TP、电压转换芯片、开关

最关键的:Connector 使用寿命:平均模块插拔 1 次花费 0.6 元

痛点 2—失效率高

1. DSP FW 烧录工具版本多,每种 DSP 各 1 个。2 个 Mcu 也

有各自的烧录工具,对新人不友好,容易搞混

2. DSP FW 烧录不稳定

3. Mcu 的 FW 有多个版本,且烧录不稳定

4. 每个 BERT 正常板,要烧录 3 个 FW,3 个 FW 烧录都要接

排线,容易接错线,或接触不良

痛点 3—软件问题

1. 采用子母板结构,母板的理论寿命超过 100 年,Connector 的损耗由子板承担,子板很便宜,因为只有

Connector 一个器件,也便于子板重工 Connector 后再次利用

2. 4 个高频头,保留 2 个即可

3. DSP 散热器,用低成本的普通散热片替代,可靠性通过 TCT 1000h 测试

4. Mcu1 及其附属电路,功能可以被 BERT 板上其他器件代替

5. Mcu2 及其附属电路,用外置的即可

6. 5 个电源输入连接器,用 2 个即可

7. EEPROM 换便宜的 Flash

8. 2 路 156MHz 时钟,只用 1 路即可

9. TP 去掉、不用的电压转换芯片、开关去掉……

痛点 1—成本高

1. 采用子母板结构,母板的理论寿命超过 100 年

2. EEPROM 换成 Flash,Flash 不怕撞件,且能手工更换

3. FW 下载不良:去掉了 2 个 Mcu,只需下载 DSP 的 FW,DSP FW 通过 USB 下载,成功率 100%

4. 0201 器件,换成 0402 器件

5. USB5V 转 3.3V LDO,换成 1A 大 LDO

6. 6V 转 3.3V DC-DC 失效:增加了过压、防反接保护器件

痛点 2—失效率高

1. 升级了烧录工具,1 个工具支持所有 BERT 板烧录

2. 采用 USB 烧录,成功率 100%

3. 去掉了 2 个 Mcu,只需烧录 DSP 的 FW

痛点 3—软件问题

59

第63页

结晶

QUINTESSENCE

1. 高频性能逊于 BERT 正常板

BERT 子母板高频性能下降是符合预期的,但不影响它的正常使用,目前 BERT 子母板通过了 RD、MFG 的

认证测试,在走小批量验证。

2. 要装配子板,多上 2 颗螺丝

3. 采用外置通讯,要通过排线连接 BERT 母板和外置通讯板

4. ATS 软件需要升级,增加 DSP 控制的初始化,及 DSP LTX 的参数优化

1. 总结了 BERT 正常板的缺陷

2. 开发了 BERT 子母板,它们在成本,可靠性上,有绝对优势

3. BERT 子母板也有缺陷,但不影响它的正常使用

4. BERT 子母板通过了 RD,MFG 认证测试,在走小批量验证

5. 随着公司 400G/800G 模块大量出货,对 BERT 正常板的年需求量很大,如果采用 BERT 子母板,成本预

计可以降低 80% 以上,带来的直接效益相当可观

四、BERT 子母板的缺陷

五、总结

BERT 正常板电眼 BERT 子母板电眼

60

第64页

编读往来

NOTES FROM THE EDITOR

编读往来

Notes from the editor

In 2023, we faced challenges, encountered surprises, and demonstrated our strength!

We witnessed the rapid development of the industry,

navigating through both opportunities and challenges present in the market.

Each time we confronted obstacles and explored innovations,

we emerged stronger and more confident.

We progressed and grew amidst trials and tribulations.

Through continuous exploration, pursuits, and achievements,

we discovered a brand-new version of ourselves, and a world that is more diverse and exciting.

The road ahead is wide open, with countless exciting possibilities to look forward to.

2023 年,有挑战,有惊喜,有底气!

我们见证了行业快速的发展,

拥抱市场的机遇与挑战。

每一次迎难而上,每一次创新探索,

变得更有底气,更有态度。

在磨砺中成长,在历练中蜕变,

探索、追寻、触及,

发现全新的自己和更为精彩的世界。

前路浩浩荡荡,万事皆可期待。

As we step into 2024, let us tackle all challenges head-on, embrace transformations,

and become InnoLight employees who are courageous, resilient, and full of creativity.

Remember, you are not alone in this journey;

believe in the power of teamwork and us.

In this vast world, let us join hands and stride toward a brighter future.

Let us embark on this new journey together!

2024 年,直面挑战,拥抱变化,

成为一个勇敢、坚韧、充满创造力的旭创人。

要知道,你并不是一个人在战斗,

相信团队的力量,相信“我们”的力量。

天地宽广,并肩同行 ,

向未来 , 向着更好的明天,昂首出发!

61

第65页

编读往来

NOTES FROM THE EDITOR

62

百万用户使用云展网进行互动电子书制作,只要您有文档,即可一键上传,自动生成链接和二维码(独立电子书),支持分享到微信和网站!
收藏
转发
下载
免费制作
其他案例
更多案例
免费制作
x
{{item.desc}}
下载
{{item.title}}
{{toast}}