感觉自己花了好多时间,做了一个伪需求,尴尬😓

68 天前
 mrergouwang666

你们觉得是个伪需求吗?

https://www.imagedescriber.site

7511 次点击
所在节点    程序员
67 条回复
mrergouwang666
68 天前
有大佬分享一下怎么发现需求,如何知道一个需求应不应该做呢?
mrergouwang666
68 天前
好吧,还没做完,花了好几个月,还是个半成品,没一点水花,在考虑要不要继续进行下去,求大佬给点意见,万分感谢。
osilinka
68 天前
感觉没有多大需求啊,还不如加水印
mrergouwang666
68 天前
@osilinka 做完之后,我也意识到了,嗐
TimePPT
68 天前
image caption ,加个图片问答?这个随便一个多模理解模型都能做的事,没啥意义啊
mrergouwang666
68 天前
@TimePPT 图片问答是啥意思? 老哥可以具体说下吗,万分感谢
Leon6868
68 天前
not even wrong:

- 对于开发者,你的服务没有亮点,定价也不便宜。举个例子,我用 GLM-4V-Flash 完全可以免费替代你的产品,你的亮点在哪?
- 对于普通用户,ChatGPT 、Qwen 、豆包都支持免费的多模态问答和 Agent 功能,你的竞争点在哪?
mrergouwang666
68 天前
@Leon6868 嗯嗯 是的,感谢老哥的回复,接下来的产品我会好好思考
msg7086
68 天前
需求该不该做:你自己会付费用这个服务吗?
mrergouwang666
68 天前
@msg7086 是的,说的太好了
twig
68 天前
这个功能是有用的。因为泛泛地说,任何一个功能都是有用的,只是你需要找到觉得它有用的人……

感觉作为一个独立的网页,对于用户实际应用的场景是很远的。

什么场合需要描述图片内容呢?

- 用户拍了照上传 Instagram ,想写一句话炫耀
- 创作者写完博客,上传图片,为了 accessibility 想加一个 alt 注释
- 报纸或者杂志的网站的编辑写完稿子之后,发表之前需要在每幅配图下面配一句话(你猜猜中国杂志界把这个东西叫什么?)

所以现在的问题是:

- 你能打通 Instagram 的 iOS app 吗?感觉很难。你能做一个浏览器插件,适配常见的社交网络吗?比如,用户打开「发推」的界面,上传完图片,就自动帮他总结图片。
- 你能写个 PHP 的东西,做成 WordPress 插件吗?这个确实是很多人会花钱买的。因为 WordPress 用户都是不会写代码的。
- 同样的道理,你能打通报纸、杂志网站的 CMS 吗?给他们编辑新闻的界面加一个按钮,点一下就掉用你的服务总结一下。然而你看你都不知道中国杂志界把这个东西叫什么,整合进去也不容易吧。

还有就是你的 UI 啊……无力吐槽啊……
twig
68 天前
生成描述之后有一个 复制,有一个下载 JSON 。

你面向的用户是谁啊?普通用户的话,你让普通用户下载 JSON 干啥?码农的话,我用你这玩意儿干啥?

你给我生成出来的是啥文本格式啊?

```
Here are a few options for a catchy caption, choose the one that best fits your desired tone!

Option 1 (Sweet & Simple): Sweet and serene, radiating youthful charm in her classic sailor uniform. Pure school day vibes! 🌸

Option 2 (Reflective): A gentle smile and a moment of calm reflection. There's a timeless beauty in youthful innocence and a crisp school uniform. ✨

Option 3 (Engaging): Fresh faces and classic uniforms never go out of style! Loving this sweet schoolgirl aesthetic. 😊

Appropriate Hashtags: #SchoolGirl #SailorUniform #Seifuku #YouthfulVibes #SweetSmile #StudentLife #AsianBeauty #Portrait #Innocence #FreshFace #UniformStyle #SchoolDays #CuteGirl #GentleLook
```

能不能搞搞 prompt engineering ,让 LLM 直接生成结构化的数据,你自己先 parse 好,最后把干干净净的字给用户。最后给用户一句话、几个 hashtag ,用户点一下「复制」就能利利索索的复制走,直接贴到 Instagram 里?

像这样:

soo2
68 天前
我艹,这正是我需要的需求!我有很多张 meme 图。一直想将其归类,根据内容重命名,这样日后使用的时候就很容易找到。手动弄了几百张就搞不下去了,只有用 AI 搞了。
KuroNekoFan
68 天前
还挺好玩的,除了选了中文输出结果输出了英语
piku
68 天前
没看懂,好像是给视障人士使用的“描述图片”?
slackerman
68 天前
11 楼说的没错,有点用,但是离用户太远,可能要集成到某类相关 APP 中才容易被用到
moefishtang
68 天前
你的网页被卡巴斯基拦截了...
(今天 Imgur 怎么上传不了图片...报 400 号错误
LongLights
68 天前
这个需求的确是有的:
1. 网站主给图片加 alt 标签
2. 发布平台生成文案(这里和 alt 标签的描述风格应有差异)
3. 视障人士读屏

但是我能想到的以上及类似需求需要更高的集成度,比如做成 php 网站的插件之类的
opengps
68 天前
花了大精力去证明了这个事属于“伪需求”,本身也是收获的过程
NoobNoob030
68 天前
做个 MCP 接口,作为一个小工具发布到别的平台是 OK 的,也许可以收获一点名气,但是想赚米还是困难

作为独立产品去运营,没有核心竞争力且市场需求不大,多模态可以实现你的功能

最佳定位:小众玩具

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1163766

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX