Filip Boltuzic
Verified Expert in Engineering
机器学习工程师和开发人员
Filip是一名拥有多年专业经验的机器学习工程师. 作为软件开发人员,他曾在亚马逊网络服务公司(Amazon Web Services)从事大规模问题的研究,并在萨格勒布大学(University of Zagreb)担任助理研究员,建立了自然语言处理模型. 菲利普的主要兴趣是机器学习和自然语言处理, 重点是建立文本分类模型.
Portfolio
Experience
Availability
首选的环境
Java, Git, Linux, Docker, Apache Solr, Django, PyTorch, Pandas, NumPy, Scikit-learn, Python
The most amazing...
...我开发的机器学习模型是一个LSTM和CRF模型,用于将文本分割为论证性声明,这是我博士学位的一部分.D. thesis.
Work Experience
Research Advisor
在线自由职业机构
- 调查、研究和记录软件中的缓存方法.
- 复制了最流行的缓存方法来预测研究论文中的生存时间.
- 建立了一个模拟器和强化学习模型,试图解决对象缓存的TTL预测问题.
RAG/GPT4 Expert
Inflexion
- 改进了现有的基于rag的工具,以帮助团队更有效地搜索内部文档.
- 为不同类型的内容(电子邮件)建立文档处理系统, DOCX attachments, Excel电子表格, etc).
- 利用RAG实现了第一个版本的多题答题.
技术博客作者
Agnostiq
- 写了几篇关于各种主题的技术博客,比如机器学习, 量子计算, cloud computing, 以及大型语言模型.
- 跨三个云提供商(AWS、Google cloud和Azure)实现可重复的工作流.
- 对开源工作流covalent库做出了贡献.
AI和ML开发人员
Aggieland软件
- 开发大型语言模型(LLM) LangChain bot生成软件需求.
- 构建并部署到云上的多进程应用程序通过API公开,该API可以与用户聊天以生成软件需求.
- 与两个团队合作,通过api集成LLM应用程序,提供web和移动应用程序访问LLM应用程序.
AI Expert
PD4 Solutions LLC
- 开发了一个基于llm的解决方案,以确定哪些科学文章与用户输入的自由文本标准相关.
- 评估了LLM解决方案的性能,并演示了证明比以前实现的解决方案有很大改进的指标.
- 与机器学习工程师一起部署解决方案并定义应用LLM解决方案的最佳架构.
高级数据科学家
Lionbridge自由撰稿人(通过Newfire Global Partners)
- 在文本数据上开发了一个机器学习序列标注模型,达到0以上.9 F1 score.
- 在不牺牲F1分数的情况下,减少了先前开发的机器学习模型的推理时间.
- 使用PySpark和Databricks执行大规模的数据分析,公司使用这些数据来推动未来的业务决策.
- 开发了多个高度可伸缩的Python web服务,这些服务目前正在为生产流量服务.
数据科学工程师
BJS
- 开发原型产品推荐,显示客户的购买模式.
- 构建简单的AWS Lambda函数来执行ETL工作流.
- Worked with PySpark on large sets of data (>100GB of historical purchases).
机器学习工程师
Alchemy V Ltd(通过Toptal)
- 使用拥抱脸转换器/文本生成管道和客户提供的数据创建了一个营销口号文本生成器.
- 通过多个Google云服务BigQuery创建了一个数据摄取和报告流程, Cloud Functions, Cloud Endpoints, and Dataproc.
- 将现有的R报告代码移植到Python web服务中.
自然语言处理顾问
格兰维尔知识管理(通过Toptal)
- 开发了一个刮板下载一个大型(约20,000)和各种法律文件(1990年至今)从欧洲公共存储库.
- 利用机器学习构建文本分类模型,实现基于文档内容的自动分类.
- 创建了一个法律文件数据集,并使用它来训练和评估构建的机器学习文本分类模型. 通过谷歌协作共享结果,这样客户就可以用他们持有的数据交互地尝试模型的性能.
研究助理
萨格勒布大学的实验室
- 开发了克罗地亚法律文件的搜索引擎.
- 结合LSTM和CRF,在PyTorch中构建了一个命名实体识别模型.
- 指导过几个学生做实习项目,并撰写了自然语言处理方面的硕士论文.
软件开发工程师
亚马逊网络服务(AWS)
- 用Java和c++开发了一个可伸缩的时间序列数据库解决方案, 它每秒处理大约100万个请求.
- 担任团队scrum主管和产品负责人.
- 设计并实现了一个网络关联引擎微服务来处理来自整个亚马逊网络的网络事件(专利授予http://patents).justia.com/inventor/filip-boltuzic).
商业智能分析师
萨格勒巴卡联合信贷银行集团
- 开发SQL报告,以确定数据仓库中有前景的零售策略.
- 用Java构建了一个交互式工具,以加快Oracle Data Integrator中的流程.
- 使用PL/SQL和Oracle Apex为会计部门开发小型web应用程序.
Experience
克罗地亚法律文件搜索引擎
我是这个项目的首席开发人员,并提出了系统架构作为一组微服务. 文档在Solr中存储和索引, 而Django前端提供请求并与Solr通信.
零售额预测
Ulpian
http://ulpian.eu该工具目前正在一家名为Ulpian的初创公司开发中.
Education
Ph.D. 自然语言处理专业
萨格勒布大学-萨格勒布,克罗地亚
计算机科学硕士学位
萨格勒布大学-萨格勒布,克罗地亚
伊拉斯谟计算机科学交流学习
KTH皇家理工学院-斯德哥尔摩,瑞典
计算机科学学士学位
萨格勒布大学-萨格勒布,克罗地亚
Certifications
卷积神经网络
Coursera
Skills
Libraries/APIs
Scikit-learn, NumPy, Pandas, PyTorch, Google Cloud API, SpaCy, 自然语言工具包(NLTK), PySpark, LSTM, Spark ML
Tools
Vim Text Editor, Solr, Apache Solr, Git, Oh My Zsh, Boto, Jupyter, LaTeX, Azure机器学习, ChatGPT, Haystack
Languages
Python, SQL, Haskell, Java, c++, R
Paradigms
数据科学、异常检测、敏捷、Scrum、商业智能(BI)、DevOps
Storage
Elasticsearch, Google Cloud, JSON, PostgreSQL
Platforms
亚马逊网络服务(AWS)、Linux、Docker、Databricks、SolrCloud、Azure、谷歌云平台(GCP)
Frameworks
Django, Scrapy, streamlight
Other
自然语言处理(NLP), GPT, 生成预训练变压器(GPT), 人工智能(AI), Machine Learning, Back-end, OpenAI GPT-3 API, Data Analysis, Azure Databricks, 检索增强生成(RAG), 聚类算法, Clustering, 分类算法, 文本分类, Torch, Web Scraping, 谷歌合作实验室(Colab), Google BigQuery, Text Generation, Web Services, 开放神经网络交换(ONNX), Neural Networks, Research, 学生参与, 监督式机器学习, Time Series, 自回归综合移动平均线(ARIMA), LangChain, OpenAI, 强化学习, 深度强化学习, Algorithms, Programming, Heuristics, Optimization, 进化计算, 遗传算法, 卷积神经网络(CNN), 排序算法, 模式识别, Language Models, 无监督学习, Big Data, 非结构化数据分析, 大型语言模型(llm), Llama 2, FastAPI, 提示工程, OpenAI GPT-4 API, Pinecone, FAISS
如何使用Toptal
在数小时内,而不是数周或数月,我们的网络将为您直接匹配全球行业专家.
Share your needs
选择你的才能
开始你的无风险人才试验
对顶尖人才的需求很大.
Start hiring