V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  Xs0ul  ›  全部回复第 3 页 / 共 38 页
回复总数  750
1  2  3  4  5  6  7  8  9  10 ... 38  
2022-07-13 03:29:13 +08:00
回复了 freelancher 创建的主题 问与答 大家长时间出国工作的话,一般会带什么行李呢?
地图上找附近亚超(如果在欧美工作),基本上啥都买得到。买电饭煲一般比买菜简单
2022-07-06 05:20:22 +08:00
回复了 Richard14 创建的主题 问与答 Bert 神经网络结构中是否使用了多头自注意力机制?
我记得输出是 [batch_size, 句子最大长度,vocab_size],也就是输出填好以后的整段话。但可以把非 mask 的位置上的 loss 屏蔽掉不参与 BP
2022-06-30 04:38:33 +08:00
回复了 Richard14 创建的主题 问与答 Bert 神经网络结构中是否使用了多头自注意力机制?
可能没说清楚,你可以先看一眼可选的 config: https://huggingface.co/docs/transformers/model_doc/bert#transformers.BertConfig
里面有两个参数分别是 num_hidden_layers 和 num_attention_heads ,而它们的默认值刚好都是 12.

你说打印出来看起来像是线性的 12 层,这是个 num_hidden_layers: https://github.com/huggingface/transformers/blob/main/src/transformers/models/bert/modeling_bert.py#L577, 可以从源代码看出来确实是线性进行的。

而 multihead 的并行,是我上面发的那个,包括往下几行的 forward 。这个在打印的结构里是没有体现的
2022-06-30 01:30:15 +08:00
回复了 Richard14 创建的主题 问与答 Bert 神经网络结构中是否使用了多头自注意力机制?
2022-06-28 22:22:26 +08:00
回复了 jasondennis12139 创建的主题 宽带症候群 请教留学在外如何回国冲浪?
弹幕很多人都提到了,再提两个不大不小的问题
1. YouTube 更新剧往往要慢一点,这样会导致没法和朋友讨论,也容易被剧透。
2. YouTube 对版权音乐的审核很严格,会出现国内综艺在 YouTube 上没背景音乐版权的情况,这段时间就只能消音。这个对一些音乐和选秀节目观看感受影响挺大的
2022-06-22 22:24:47 +08:00
回复了 hertzry 创建的主题 职场话题 深度学习的老哥能不能帮忙看一下简历
1. 建议项目里(比如第三个)不要把所有你试过的方法一股脑全摆上去,这样会给人一种理解不深,只是把所有能用的方法试了一遍的感觉。
2. 另外介绍模型的时候,很少直接写 CNN ,因为 CNN 的模型太多了,得写的更具体一点
3. 技能清单里的 GNN ,不知道是不是指 graph 的。这个其实相对 CNN 或者 sequential 的模型,是用的比较少的,应该是个亮点。建议多介绍下什么为什么用 GNN ,效果如何
2022-06-22 10:48:59 +08:00
回复了 kkkiio 创建的主题 Jira JIRA 是伪需求吗?
IM 当入口确实有,slack 就有 jira 的插件
2022-06-22 04:39:40 +08:00
回复了 kkkiio 创建的主题 Jira JIRA 是伪需求吗?
1. 协同文档还有 confluence ,和 jira 一样是 Atlassian 的
2. 用 IM 很难说,但想象了一下要查过去某个 ticket 会很麻烦
2022-05-24 21:49:36 +08:00
回复了 taofoo 创建的主题 字体排印 有 word 大神吗
因为你设置了 3 倍行距?
2022-05-24 00:34:12 +08:00
回复了 13936 创建的主题 分享发现 救命,千万别用百度翻译
"Can you flowing my requirement?" 这句话本身就挺怪的,不知道是不是打错了。更常见的应该是 fulfill 或者 follow
2022-05-19 05:35:57 +08:00
回复了 weidaizi 创建的主题 随想 看完《看完房贴文有感》有感 - 你觉得房价收入比多少合理
有一点,跨国比较的时候,不少国家是有房产税的
这个图片说的是多项式拟合时次数过低和过高时带来的欠拟合和过拟合,和楼主描述的不是同一回事
2022-04-27 02:42:50 +08:00
回复了 xiaoyu2er 创建的主题 推广 [润] 我为什么离开北京,选择赴美工作?
关于 h1b 抽签,今年本科学历的中签率估计只有 20%,硕士及以上大概 40%,所以即使是抽 4 次也是有可能翻车的,得做好准备。同时 day-1 cpt 不管是找工作,还是之后 h1b 、绿卡被 RFE 的风险,都要考虑清楚。

day-1 cpt 更多的是给 h1b 3 抽 4 抽不中拿来续命的。如果想润,建议申请更正规的学校和专业
2022-04-19 22:29:00 +08:00
回复了 3dwelcome 创建的主题 算法 构建一个完美无冲突的 hashmap。
像之前有人回复的,这个更像利用了 hash 的搜索算法。并且,这样的算法想要有实用性,得证明碰撞的概率够低,并且不同的 hash 算法碰撞还得足够独立的,不然就会多次冲突导致要添加很多层 bitmap 。

所以比较重要的部分是,如何选择 hash 的算法,而不是楼主描述的这个过程。举个例子,对于给定的查询集合,比如一堆文件,可以生成一堆 hash 函数:h(x), h(x+1), h(x+2)...,来试验怎么样的组合能在最少的次数完成这个多重 hash map 的构造。同时,hash 函数的值域越大,碰撞概率越低,但对应的 bitmap 需要的空间也越大,这里如何选择也是需要研究的。要有实用性,这些选择都应该能自动完成,但楼主提到的部分并没有讨论这些问题
2022-04-19 04:09:13 +08:00
回复了 3dwelcome 创建的主题 算法 构建一个完美无冲突的 hashmap。
试图总结一下楼主的算法,看看整理的对不对:
前提:需要查询的集合是有限并且已知的
算法:
1. 取某种 hash 算法 A ,对整个查询集应用一次这个 hash 算法 A 。假设这个 A 算法可能产生的值有 1000 种,那么需要一个对应大小的 bitmap ,用来记录每个 hash 在这个给定的查询集合上是否冲突。
2. 在 hash 算法合适的情况下,会有少量的冲突,这时候再取 hash 算法 B ,重复步骤 1 并产生一个新的 bitmap
3. 如此不停的重复直到无冲突

查询:
对某个 input X ,先应用 hash 算法 A ,查看对应的 bitmap A 是否有冲突,没有则可以直接用 hash map A ;否则再用 hash 算法 B ,查看对应的 bitmap B ,以此类推
2022-03-23 05:40:10 +08:00
回复了 wuxkwnjjwoxk 创建的主题 游戏 原神抽卡可能存在区别对待吗?
1. 原神设置的 5 星几率很低,而保底抽数同样设置的相对低,这样使期望和保底数已经很接近了,整体上已经降低了玩家之间的方差,脸黑也就是比期望多了十抽,而同时狗的概率非常低。
2. 在整体人群概率已经验证了没问题的前提下,要假设有猫腻也是可行的,比如给玩家分层,一部分人欧一部分人非,这样平均下来还是期望的概率。但是这样的分层如果简单,依然可以被假设检验验证出来,只是需要的样本数更多。同样,分层的假设越复杂,比如同一个人每个月每个卡池的概率也是动态变化的,那这样的假设就更难以验证。到那种地步,基本也就是“抛开事实不谈”了,完全取决于你有多不相信策划
2022-03-19 03:15:10 +08:00
回复了 zxCoder 创建的主题 问与答 问个数学问题 关于机器学习 SVM
maxmin 举个现实中直观的例子,比如刚毕业找初级的职位,又想挑工资高的,那就要找初级职位给的多的,也就是 max_{公司} ( min_{公司, 职位} (工资) )
2022-02-26 01:31:48 +08:00
回复了 x97bgt 创建的主题 程序员 一道贝叶斯概率题
感觉是我理解错题意了,这么化简不对
1  2  3  4  5  6  7  8  9  10 ... 38  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1355 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 38ms · UTC 16:44 · PVG 00:44 · LAX 09:44 · JFK 12:44
Developed with CodeLauncher
♥ Do have faith in what you're doing.