Ich stimme zu, dass diese Seite Cookies verwende. Weitere Informationen finden Sie unter unseren
Datenschutzerklärungen
.
X
Login
Merkliste (
0
)
Startseite
Über uns
Startseite Über uns
Neues aus der SuUB
Geschichte der SuUB
Bibliotheksprofil
Presseinformationen
Freundeskreis
Die Bibliothek in Zahlen
Ausstellungen
Projekte
Ausbildung, Praktika und Stellenangebote
Filme zur Staats- und Universitätsbibliothek Bremen
Service & Beratung
Startseite Service & Beratung
Ausleihe & Fernleihe
Rückgabe & Verlängerung
Schulungen & Führungen
Mein Bibliothekskonto
Bibliotheksausweis
Neu in der Bibliothek?
Informationsmaterialien, Formulare und Pläne zum Download
Öffnungszeiten
Lernort Bibliothek
PC, WLAN, Kopieren, Scannen, Drucken
Kataloge & Sammlungen
Startseite Kataloge & Sammlungen
Historische Sammlungen
Digitale Sammlungen
Fachinformationen
Standorte
Startseite Standorte
Zentrale
Juridicum
Bereichsbibliothek Wirtschaftswissenschaft
Bereichsbibliothek Physik / Elektrotechnik
Teilbibliothek Technik und Sozialwesen
Teilbibliothek Wirtschaft und Nautik
Teilbibliothek Musik
Teilbibliothek Kunst
Teilbibliothek Bremerhaven
Kontakt
Startseite Kontakt
Liste der Ansprechpartner
Open Access & Publizieren
Startseite Open Access & Publizieren
Literaturverwaltung
Literatur Publizieren
Open Access in Bremen
Toggle navigation
Hubinger, Evan
35
Ergebnisse:
Personensuche
X
Sortierung: Relevanz
Sortierung: Jahr
?
1
Sleeper Agents: Training Deceptive LLMs that Persist Throug..:
Hubinger, Evan
;
Denison, Carson
;
Mu, Jesse
...
http://arxiv.org/abs/2401.05566. , 2024
Link:
http://arxiv.org/abs/240..
?
2
Steering Llama 2 via Contrastive Activation Addition:
Rimsky, Nina
;
Gabrieli, Nick
;
Schulz, Julian
...
http://arxiv.org/abs/2312.06681. , 2023
Link:
http://arxiv.org/abs/231..
?
3
Question Decomposition Improves the Faithfulness of Model-G..:
Radhakrishnan, Ansh
;
Nguyen, Karina
;
Chen, Anna
...
http://arxiv.org/abs/2307.11768. , 2023
Link:
http://arxiv.org/abs/230..
?
4
Measuring Faithfulness in Chain-of-Thought Reasoning:
Lanham, Tamera
;
Chen, Anna
;
Radhakrishnan, Ansh
...
http://arxiv.org/abs/2307.13702. , 2023
Link:
http://arxiv.org/abs/230..
?
5
Conditioning Predictive Models: Risks and Strategies:
Hubinger, Evan
;
Jermyn, Adam
;
Treutlein, Johannes
..
http://arxiv.org/abs/2302.00805. , 2023
Link:
http://arxiv.org/abs/230..
?
6
Studying Large Language Model Generalization with Influence..:
Grosse, Roger
;
Bae, Juhan
;
Anil, Cem
...
http://arxiv.org/abs/2308.03296. , 2023
Link:
http://arxiv.org/abs/230..
?
7
Engineering Monosemanticity in Toy Models:
Jermyn, Adam S
;
Schiefer, Nicholas
;
Hubinger, Evan
http://arxiv.org/abs/2211.09169. , 2022
Link:
http://arxiv.org/abs/221..
?
8
Discovering Language Model Behaviors with Model-Written Eva..:
Perez, Ethan
;
Ringer, Sam
;
Lukošiūtė, Kamilė
...
http://arxiv.org/abs/2212.09251. , 2022
Link:
http://arxiv.org/abs/221..
?
9
An overview of 11 proposals for building safe advanced AI:
Hubinger, Evan
http://arxiv.org/abs/2012.07532. , 2020
Link:
http://arxiv.org/abs/201..
?
10
Risks from Learned Optimization in Advanced Machine Learnin..:
Hubinger, Evan
;
van Merwijk, Chris
;
Mikulik, Vladimir
..
http://arxiv.org/abs/1906.01820. , 2019
Link:
http://arxiv.org/abs/190..
?
11
evhub/coconut: Coconut v3.0.3:
Evan Hubinger
;
Fred Buchanan
;
Ken Baskett
...
https://github.com/evhub/coconut/tree/v3.0.3. , 2023
Link:
https://zenodo.org/recor..
?
12
kiudee/bayes-skopt: bayes-skopt 0.10.9 (19 July 2023):
Karlson Pfannschmidt
;
pyup.io bot
;
Aksh Gupta
..
https://github.com/kiudee/bayes-skopt/tree/v0.10.9. , 2023
Link:
https://zenodo.org/recor..
?
13
evhub/coconut: Coconut v3.0.2:
Evan Hubinger
;
Fred Buchanan
;
Ken Baskett
...
https://github.com/evhub/coconut/tree/v3.0.2. , 2023
Link:
https://zenodo.org/recor..
?
14
evhub/coconut: Coconut v3.0.1:
Evan Hubinger
;
Fred Buchanan
;
Ken Baskett
...
https://github.com/evhub/coconut/tree/v3.0.1. , 2023
Link:
https://zenodo.org/recor..
?
15
kiudee/bayes-skopt: bayes-skopt 0.10.9 (19 July 2023):
Karlson Pfannschmidt
;
pyup.io bot
;
Aksh Gupta
..
https://github.com/kiudee/bayes-skopt/tree/v0.10.9. , 2023
Link:
https://zenodo.org/recor..
1-15