Skip to content

Commit e0e9fe5

Browse files
authored
[utc] set utc-base as default model (PaddlePaddle#4825)
1 parent e0a4aa4 commit e0e9fe5

File tree

3 files changed

+14
-14
lines changed

3 files changed

+14
-14
lines changed

applications/zero_shot_text_classification/deploy/simple_serving/README.md

+1-1
Original file line numberDiff line numberDiff line change
@@ -68,7 +68,7 @@ service.register_taskflow("taskflow/utc", [utc1, utc2])
6868
```
6969

7070
* `schema`:定义任务标签候选集合。
71-
* `model`:选择任务使用的模型,默认为`utc-large`, 可选有`utc-xbase`, `utc-base`, `utc-medium`, `utc-micro`, `utc-mini`, `utc-nano`, `utc-pico`
71+
* `model`:选择任务使用的模型,默认为`utc-base`, 可选有`utc-xbase`, `utc-base`, `utc-medium`, `utc-micro`, `utc-mini`, `utc-nano`, `utc-pico`
7272
* `max_seq_len`:最长输入长度,包括所有标签的长度,默认为512。
7373
* `batch_size`:批处理大小,请结合机器情况进行调整,默认为1。
7474
* `pred_threshold`:模型对标签预测的概率在0~1之间,返回结果去掉小于这个阈值的结果,默认为0.5。

docs/model_zoo/taskflow.md

+12-12
Original file line numberDiff line numberDiff line change
@@ -1729,20 +1729,20 @@ from paddlenlp import Taskflow
17291729
```
17301730
>>> cls = Taskflow("zero_shot_text_classification", schema=["这是一条好评", "这是一条差评"])
17311731
>>> cls("房间干净明亮,非常不错")
1732-
[{'predictions': [{'label': '这是一条好评', 'score': 0.9695149765679986}], 'text_a': '房间干净明亮,非常不错'}]
1732+
[{'predictions': [{'label': '这是一条好评', 'score': 0.9072999699439914}], 'text_a': '房间干净明亮,非常不错'}]
17331733
>>> cls("东西还可以,但是快递非常慢,下次不会再买这家了。")
1734-
[{'predictions': [{'label': '这是一条差评', 'score': 0.903727367612172}], 'text_a': '东西还可以,但是快递非常慢,下次不会再买这家了。'}]
1734+
[{'predictions': [{'label': '这是一条差评', 'score': 0.9282672873429476}], 'text_a': '东西还可以,但是快递非常慢,下次不会再买这家了。'}]
17351735
```
17361736

17371737
#### 意图识别
17381738

17391739
```
17401740
>>> from paddlenlp import Taskflow
1741-
>>> schema = ["病情诊断", "治疗方案", "病因分析", "指标解读", "就医建议", "疾病表述", "后果表述", "注意事项", "功效作用", "医疗费用", "其他"]
1741+
>>> schema = ["病情诊断", "治疗方案", "病因分析", "指标解读", "就医建议", "疾病表述", "后果表述", "注意事项", "功效作用", "医疗费用"]
17421742
>>> cls("先天性厚甲症去哪里治")
1743-
[{'predictions': [{'label': '就医建议', 'score': 0.9628814210597645}], 'text_a': '先天性厚甲症去哪里治'}]
1743+
[{'predictions': [{'label': '就医建议', 'score': 0.5494891306403806}], 'text_a': '先天性厚甲症去哪里治'}]
17441744
>>> cls("男性小腹疼痛是什么原因?")
1745-
[{'predictions': [{'label': '病因分析', 'score': 0.9925820373324141}], 'text_a': '男性小腹疼痛是什么原因?'}]
1745+
[{'predictions': [{'label': '病因分析', 'score': 0.5763229815300723}], 'text_a': '男性小腹疼痛是什么原因?'}]
17461746
```
17471747

17481748
#### 语义相似度计算
@@ -1751,30 +1751,30 @@ from paddlenlp import Taskflow
17511751
>>> from paddlenlp import Taskflow
17521752
>>> cls = Taskflow("zero_shot_text_classification", schema=["不同", "相同"])
17531753
>>> cls([["怎么查看合同", "从哪里可以看到合同"]])
1754-
[{'predictions': [{'label': '相同', 'score': 0.9775065319076257}], 'text_a': '怎么查看合同', 'text_b': '从哪里可以看到合同'}]
1754+
[{'predictions': [{'label': '相同', 'score': 0.9951385264364382}], 'text_a': '怎么查看合同', 'text_b': '从哪里可以看到合同'}]
17551755
>>> cls([["为什么一直没有电话来确认借款信息", "为何我还款了,今天却接到客服电话通知"]])
1756-
[{'predictions': [{'label': '不同', 'score': 0.9918983379165037}], 'text_a': '为什么一直没有电话来确认借款信息', 'text_b': '为何我还款了,今天却接到客服电话通知'}]
1756+
[{'predictions': [{'label': '不同', 'score': 0.9991497973466908}], 'text_a': '为什么一直没有电话来确认借款信息', 'text_b': '为何我还款了,今天却接到客服电话通知'}]
17571757
```
17581758

17591759
#### 蕴含推理
17601760

17611761
```
17621762
>>> from paddlenlp import Taskflow
1763-
>>> cls = Taskflow("zero_shot_text_classification", schema=["中立", "蕴含", "矛盾"])
1763+
>>> cls = Taskflow("zero_shot_text_classification", schema=["无关", "蕴含", "矛盾"])
17641764
>>> cls([["一个骑自行车的人正沿着一条城市街道朝一座有时钟的塔走去。", "骑自行车的人正朝钟楼走去。"]])
1765-
[{'predictions': [{'label': '蕴含', 'score': 0.9944843058584897}], 'text_a': '一个骑自行车的人正沿着一条城市街道朝一座有时钟的塔走去。', 'text_b': '骑自行车的人正朝钟楼走去。'}]
1765+
[{'predictions': [{'label': '蕴含', 'score': 0.9931122738524856}], 'text_a': '一个骑自行车的人正沿着一条城市街道朝一座有时钟的塔走去。', 'text_b': '骑自行车的人正朝钟楼走去。'}]
17661766
>>> cls([["一个留着长发和胡须的怪人,在地铁里穿着一件颜色鲜艳的衬衫。", "这件衬衫是新的。"]])
1767-
[{'predictions': [{'label': '中立', 'score': 0.6659998351201399}], 'text_a': '一个留着长发和胡须的怪人,在地铁里穿着一件颜色鲜艳的衬衫。', 'text_b': '这件衬衫是新的。'}]
1767+
[{'predictions': [{'label': '无关', 'score': 0.997680189334587}], 'text_a': '一个留着长发和胡须的怪人,在地铁里穿着一件颜色鲜艳的衬衫。', 'text_b': '这件衬衫是新的。'}]
17681768
>>> cls([["一个穿着绿色衬衫的妈妈和一个穿全黑衣服的男人在跳舞。", "两人都穿着白色裤子。"]])
1769-
[{'predictions': [{'label': '矛盾', 'score': 0.9270557883904931}], 'text_a': '一个穿着绿色衬衫的妈妈和一个穿全黑衣服的男人在跳舞。', 'text_b': '两人都穿着白色裤子。'}]
1769+
[{'predictions': [{'label': '矛盾', 'score': 0.9666946163628479}], 'text_a': '一个穿着绿色衬衫的妈妈和一个穿全黑衣服的男人在跳舞。', 'text_b': '两人都穿着白色裤子。'}]
17701770
```
17711771

17721772
#### 可配置参数说明
17731773

17741774
* `batch_size`:批处理大小,请结合机器情况进行调整,默认为1。
17751775
* `task_path`:自定义任务路径,默认为None。
17761776
* `schema`:定义任务标签候选集合。
1777-
* `model`:选择任务使用的模型,默认为`utc-large`, 支持`utc-xbase`, `utc-base`, `utc-medium`, `utc-micro`, `utc-mini`, `utc-nano`, `utc-pico`
1777+
* `model`:选择任务使用的模型,默认为`utc-base`, 支持`utc-xbase`, `utc-base`, `utc-medium`, `utc-micro`, `utc-mini`, `utc-nano`, `utc-pico`
17781778
* `max_seq_len`:最长输入长度,包括所有标签的长度,默认为512。
17791779
* `pred_threshold`:模型对标签预测的概率在0~1之间,返回结果去掉小于这个阈值的结果,默认为0.5。
17801780
* `precision`:选择模型精度,默认为`fp32`,可选有`fp16``fp32``fp16`推理速度更快。如果选择`fp16`,请先确保机器正确安装NVIDIA相关驱动和基础软件,**确保CUDA>=11.2,cuDNN>=8.1.1**,初次使用需按照提示安装相关依赖。其次,需要确保GPU设备的CUDA计算能力(CUDA Compute Capability)大于7.0,典型的设备包括V100、T4、A10、A100、GTX 20系列和30系列显卡等。更多关于CUDA Compute Capability和精度支持情况请参考NVIDIA文档:[GPU硬件与支持精度对照表](https://docs.nvidia.com/deeplearning/tensorrt/archives/tensorrt-840-ea/support-matrix/index.html#hardware-precision-matrix)

paddlenlp/taskflow/taskflow.py

+1-1
Original file line numberDiff line numberDiff line change
@@ -513,7 +513,7 @@
513513
"task_flag": "zero_shot_text_classification-utc-pico",
514514
},
515515
},
516-
"default": {"model": "utc-large"},
516+
"default": {"model": "utc-base"},
517517
},
518518
"feature_extraction": {
519519
"models": {

0 commit comments

Comments
 (0)