chatgpt场景8:化繁为简——信息提取-凯发k8一触即发

介绍

介绍完信息总结,再聊聊信息提取,我认为这个场景是继场景 3 推理以外,第二个值得深挖的场景。这个场景有非常多的有意思的场景,比如:

  1. 将一大段文字,甚至网页里的内容,按要求转为一个表格。按照这个思路你可以尝试做一个更智能的,更易懂的爬虫插件。
  2. 按照特定格式对文章内容进行信息归类。

第二个可能比较难理解,举个 openai 里的,它的 prompt 是这样的(为了有足够空间显示内容,我仅节选了 text 里的部分内容,完整内容,可以查看):

extract the important entities mentioned in the article below. first extract all company names, then extract all people names, then extract specific topics which fit the content and finally extract general overarching themes
desired format:
company names: 
people names: -||-
specific topics: -||-
general themes: -||-
text: """powering next generation
applications with openai codex
codex is now powering 70 different applications across a variety of use cases through the openai api.
may 24, 2022
4 minute read
openai codex, a natural language-to-code system based on gpt-3, helps turn simple english instructions into over a dozen popular coding languages. codex was released last august through our api and is the principal building block of github copilot.
warp is a rust-based terminal, reimagined from the ground up to help both individuals and teams be more productive in the command-line.
terminal commands are typically difficult to remember, find and construct. users often have to leave the terminal and search the web for answers and even then the results might not give them the right command to execute. warp uses codex to allow users to run a natural language command to search directly from within the terminal and get a result they can immediately use.
“codex allows warp to make the terminal more accessible and powerful. developers search for entire commands using natural language rather than trying to remember them or assemble them piecemeal. codex-powered command search has become one of our game changing features.”
—zach lloyd, founder, warp
machinet helps professional java developers write quality code by using codex to generate intelligent unit test templates.
machinet was able to accelerate their development several-fold by switching from building their own machine learning systems to using codex. the flexibility of codex allows for the ability to easily add new features and capabilities saving their users time and helping them be more productive.
“codex is an amazing tool in our arsenal. not only does it allow us to generate more meaningful code, but it has also helped us find a new design of product architecture and got us out of a local maximum.”
—vladislav yanchenko, founder, machinet"""

prompt 有点长,我解释下,它是让 ai 将文章里的重点内容进行抽离,并将其根据特定格式进行输出。要求将文章里提到的公司、人名、主题都按照 comma separated list(按逗号空格分开)的方式罗列出来。

最后的 output 是这样的:

company names: openai, microsoft, github, pygma, replit, warp, machinet
people names: emile paffard-wray, amjad masad, zach lloyd, vladislav yanchenko
specific topics: gpt-3, openai api, azure openai service, github copilot, pygma, replit, warp, machinet
general themes: natural language-to-code, productivity, problem solving, creativity, learning

6:通过格式词阐述需要输出的格式

上述的案例,就是用到了这个技巧。这个技巧是技巧 2 的变种,比较常用于生成文本场景。其实在场景 7 中,你也可以用到这个技巧。

假设你想让 ai 总结一篇非常非常长的文章,并且按照特定格式给你总结,那你可以在文章前面明确输出的格式(为了不占用太多显示空间,我省略了正文内容,你可以在 openai 的 playground 看到)。它的意思其实是让 chatgpt 按 topic 总结,每个 topic 里按照无序列表(就是里面那个 -)将每个 topic 的主要观点罗列出来。

summarize the main points of the following speech
use the following format:
topic 1: 
- 
..
topic 2: 
- 
..
topic 10: ..
text: """
thank you so much, fred, for that lovely introduction. and thanks to the atlantic council for hosting me today.
the course of the global economy over the past two years has been shaped by covid-19 and our efforts to fight the pandemic. it’s now evident, though, that the war between russia and ukraine has redrawn the contours of the world economic outlook. vladimir putin’s unprovoked attack on ukraine and its people is taking a devastating human toll, with lives tragically lost, families internally displaced or becoming refugees, and communities and cities destroyed.
...
"""

output 是这样的:

topic 1: the war in ukraine
- the war is taking a human toll with lives lost, families displaced, and communities destroyed
- the biden administration is committed to holding russia accountable
- the war has violated international law and is a challenge to the international order
topic 2: the global economy
- the war is having negative impacts on the global economy, including higher commodity prices and inflation
- the imf and world bank will be focused on helping developing countries weather the impacts of the war
- the ultimate outcome for the global economy depends on the path of the war

关于这个场景和技巧,我想再解释一下为什么潜力很大。根据我使用各种 summary 或者信息提取的产品,我发现,ai 并不知道什么是重点,所以在总结的过程中,会丢失很多内容。如何引导 ai 进行总结,就变得非常重要,且具有一定的可玩性。


感谢  的分享,ta 提到一个使用此技巧的场景:

使用此技巧可以使输出更结构化。比如针对一篇文章进行问答,你不仅想要得到一个答案,也希望 chatgpt 的答案符合特定的格式,方便你下一步进行自动化。

比如问 “这里的债券 duration 是多少?” , 正常 gpt 模型的答案可能是 “债券 duration 是 4 年” 或 “duration 4 年”。 chatgpt 的回答不稳定,且不方便继续处理。

解法: 我们可以通过这个技巧,让模型理解我们预期的格式。并在此基础上,为了方便自动化,让模型输出特定的结构化答案 (比如 json/markdown 等)。 也可以方便集成更多的额外要求,比如增加一个”confidence level”, 并通过 prompt 的形式指定这些数值的格式与甚至区间。

比如:

{context}
question: what is bond duration mentioned here.
answer template (valid json format):
{{
"duration": $duration_numeric_value_in_year,
"confidence_level": $answer_confidence_level_high_moderate_or_low,
}}
answer:

在吴恩达的 chatgpt prompt engineering 中,有提到一个这个技巧的高级用法,在让 ai 按照特定格式输出内容的同时,还让 ai 根据内容是否满足特定条件,来判断应该输出什么结果,下面课程中的案例的 prompt(注意这个是 python 代码,有一些转义字符,可以不用管):

you will be provided with text delimited by triple quotes.
if it contains a sequence of instructions, \
re-write those instructions in the following format:
step 1 - ...
step 2 -

step n -
if the text does not contain a sequence of instructions, \
then simply write \"no steps provided.\"
\"\"\"{text}\"\"\"

简单解释下,这个 prompt 分成两步:

让 ai 将输入的 text 转为步骤(就是 prompt 里的 step 1、2)

然后还增加了一个判断,如果输入的 text 里没有 step 的内容,那么就输出 no step

假如输入的 text 是一个泡茶的步骤介绍:

making a cup of tea is easy! first, you need to get some \
water boiling. while that's happening, \
grab a cup and put a tea bag in it. once the water is \
hot enough, just pour it over the tea bag. \
let it sit for a bit so the tea can steep. after a \
few minutes, take out the tea bag. if you \
like, you can add some sugar or milk to taste. \
and that's it! you've got yourself a delicious \
cup of tea to enjoy.

那么 ai 输出的内容是这样的(因为内容中包含了步骤式的内容):

step 1 - get some water boiling.
step 2 - grab a cup and put a tea bag in it.
step 3 - once the water is hot enough, pour it over the tea bag.
step 4 - let it sit for a bit so the tea can steep.
step 5 - after a few minutes, take out the tea bag.
step 6 - add some sugar or milk to taste.
step 7 - enjoy your delicious cup of tea!

但如果我们输入的是这样的 text:

the sun is shining brightly today, and the birds are \
singing. it's a beautiful day to go for a \
walk in the park. the flowers are blooming, and the \
trees are swaying gently in the breeze. people \
are out and about, enjoying the lovely weather. \
some are having picnics, while others are playing \
games or simply relaxing on the grass. it's a \
perfect day to spend time outdoors and appreciate the \
beauty of nature.

从内容上看,这段话,没有任何步骤式的内容,所以 ai 的输出是这样的:

no steps provided.

原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/yun238423.html

(0)
打赏 微信扫一扫不于多少! 微信扫一扫不于多少! 支付宝扫一扫礼轻情意重 支付宝扫一扫礼轻情意重
上一篇 2023年6月29日
下一篇 2023年6月29日

相关推荐

  • 如何使用粘贴 在 windows 中使用 ai 在 powertoys 中使用“高级粘贴”

    为了简化以不同格式粘贴内容的过程,powertoys 现在提供了一项名为“高级粘贴”的新功能。因为它可以更轻松地粘贴不同格式的内容,所以非常适合开发人员和编码人员,并且还具有 ai…

    2024年5月28日 win 11
  • 在windows上打开sdr文件的2种简单方法

    使用 smartdraw 应用程序创建的文件使用 .sdr 文件扩展名。smartdraw 是一种基于 web 的图表工具,以设计流程图而闻名。在本指南中,我们将讨论打开 .sdr…

    2024年3月18日 未分类
  • wonderjourney:从文字和图片生成3d场景动画

    wonderjourney:从文字和图片生成3d场景动画 只需要1张图片就可以创建3d场景动画,从用户提供的任何位置(通过文本描述或图像)开始,并通过一系列不同但连贯的 3d 场景…

    工具软件 2023年12月12日
  • 什么是 avif 图像?

    avif 代表 av1 图像文件格式,代表了图像文件技术的前沿。这种创新格式采用先进的 av1 视频编解码器来压缩图像,展示了效率和质量的卓越融合。作为一种开放且免版税的格式,av…

    2023年11月14日
  • 抢先体验:windows 11 预览版可让您原生创建 zip、7z 和 tar 存档

    windows 11 build 25992 附带了一项未记录的更改——能够通过右键单击任何文件以 .zip、.7z 和 .tar 格式本地创建存档。此功能在 build 2023…

    2023年11月10日
  • 如何在苹果笔记中使用块引号

    在 ios 17 和 macos sonoma 中,apple 为 apple notes 添加了新的格式选项,包括块引号和新的 monostyle 样式。以下是使用它们的方法。 …

    2023年10月12日
  • 如何在midjourney掌握一致的角色

    如果您在使用 midjourney 5 时一直在努力创建具有一致角色的 ai 艺术品,您可能会对一种可以帮助您掌握创作过程的新方法感兴趣。 在《midjourney》中掌握的棘手技…

    2023年10月12日
  • ios 7 如何不用 proraw 下以 4800 万像素拍摄?空间省 15 倍!

    苹果公司推出了最新一代移动操作系统ios 17,加入了一些功能改进,当中有一个功能是iphone 14 pro系列的用户期待已久的更新,就是终于开放4800万像素非proraw格式…

    2023年9月25日 苹果apple
  • 不买 pro 的话… iphone 15 值得升级吗? 6 大重点分析!

    早前苹果推出的iphone 15系列中,到底有什么值得更新的特点? 对比iphone 13升级到14,有没有更大的升级体验呢? 现在就为各位分析一下,iphone 15 系列比 i…

    2023年9月23日 苹果apple
  • 如何在 iphone 14 pro 上使用 heif max (48 mp)(并节省相机点击的存储空间)

    最新的 iphone pro 系列配备了强大的 48 mp 传感器,可确保拍摄高度详细和水晶般清晰的照片,捕捉每一个珍贵的时刻。然而,一个潜在的缺点是全分辨率图像的大小,尤其是pr…

    2023年9月19日 苹果apple
  • microsoft正在测试edge中的另一个ai写入功能

    microsoft继续将ai功能集成并测试其产品中。获得另一项ai测试的最新产品之一是该公司的edge浏览器。在测试中至少月,ai 写作仅在 microsoft edge cana…

    工具软件 2023年9月18日
  • 在数字艺术领域,动画场景的创建是一项需要创造力和技术实力的技能。这个快速指南和教程由自由视频编辑和内容创建者 ryan collins 精心创建,他是使用 ai 艺术创建动画的大师…

    2023年9月17日
  • microsoft正在测试edge中的另一个ai写入功能

    microsoft继续将ai功能集成并测试其产品中。获得另一项ai测试的最新产品之一是该公司的edge浏览器。在测试中至少月,ai 写作仅在 microsoft edge cana…

    微软microsoft 2023年9月17日
  • 如何通过 11 个步骤轻松打开 5 个 windows 上的 rar 文件

    如何在 windows 11 上打开 rar 文件?好吧,您应该知道,现在您很容易做到这一点。今年早些时候,在build 2023大会上,microsoft宣布windows 11…

    2023年8月8日 微软microsoft
  • rufus 4.2 稳定版发布,支持 zip64、vhdx、ffu 等镜像格式

    rufus 4.2 稳定版主要支持 zip64,允许提取大于 4gb 的镜像;此外还支持 vhdx 和 ffu 镜像格式备份和还原当前磁盘。 开发者 pete batard 今天发…

    2023年7月27日
  • 如何在 iphone 上将 heic 转换为 jpeg 格式

    默认情况下,苹果的iphone在其内部空间中以heic / f格式保存照片,当其相机镜头单击时。您无法选择在iphone上单击照片的格式设置。 虽然 heic 格式的图像可以通过任…

    2023年7月7日 苹果apple
  • 随着人工智能继续彻底改变我们与技术的交互方式,openai的chatgpt脱颖而出,成为游戏规则的改变者。这种强大的人工智能语言模型在科技界掀起了波澜,这是有充分理由的。无论您是起…

    2023年7月7日
  • 坦诚地跟大家说,我不是设计师,也不是摄影师(而且我非常不擅长摄影),所以我仅能跟大家分享一下基础内容,因为这个对我来说,太多过程性知识了,不实际操作过,根本不知道有什么。 言归正传…

    2023年6月29日 工具软件
  • 说到手办,大家应该第一反应会想起日本,再介绍一个技巧,在 prompt 里加入 japanese style 即可,拿圣女贞德作手办,以及之前做的 logo 作为例子: 圣女贞德是…

    工具软件 2023年6月29日
  • midjourney text prompt技巧三:善用 image2image 功能

    在 stock photo 场景里,还有一个非常厉害的技巧,这个方法我一开始觉得不太适合教,因为这个对 stock photo 库影响太大了 😂 但本着工具中立的原则,并且这个技巧…

    2023年6月29日
  • chatgpt技巧6:通过格式词阐述需要输出的格式

    假设你想让 ai 总结一篇非常非常长的文章,并且按照特定格式给你总结,那你可以在文章前面明确输出的格式(为了不占用太多显示空间,我省略了正文内容,你可以在 openai 的 pla…

    工具软件 2023年6月29日
  • 如果你想要更好地了解 openai 的 api,并且你常常会遇到 chatgpt 不可用的情况。那我建议你使用 openai 的 playground。它会比较稳定。 但需要注意,…

    工具软件 2023年6月29日
  • 场景介绍​ 内容生成大场景下的第二个场景是化繁为简,这个场景其实很好理解,就是将复杂的内容,转为简单的内容,一般常遇到的场景有: 信息总结:顾名思义,就是对一堆信息进行总结。 信息…

    工具软件 2023年6月29日
  • 场景介绍​ 除了回答问题外,另一个重要的场景是让 ai 根据你的要求完成一些内容生成任务,根据输出的结果差异,我将其概括为以下几个主要场景: 无中生有 锦上添花 化繁为简 本章,我…

    工具软件 2023年6月29日
  • 场景介绍​ 在问答这个大场景下,还有一个子场景是推理,这个场景非常有意思,而且是个非常值得深挖的场景,prompt 在此场景里发挥的作用非常大。 如果你想用 chatgpt api…

    工具软件 2023年6月29日
网站地图