Значительно увеличить auc что это
Значительно увеличить auc что это
AUC — аббревиатура от англоязычного Area Under the Curve (площадь под кривой). В медицинской и фармацевтической обычно используется без перевода.
AUC в фармакокинетике
AUC — фармакокинетический параметр, характеризующий суммарную концентрацию лекарственного препарата в плазме крови в течение всего времени наблюдения. Математически определяется как интеграл от 0 до ∞ функции концентрации препарата (фармакокинетической кривой) в плазме крови от времени и равен площади фигуры, ограниченной фармакокинетической кривой и осями координат. Параметр AUC связан с другими фармакокинетическими параметрами — объемом распределения, общим клиренсом. При линейности кинетики препарата в организме величина AUC пропорциональна общему количеству (дозе) препарата, попавшего в системный кровоток.
AUC T — площадь под частью фармакокинетической кривой, от начала исследования (t = 0) до некоторого времени t = T (обычно заданное в часах). Например, AUC24 равен площади под фармакокинетической кривой в течение первых 24-х часов исследования.
AUC в исследовании кислотности органов желудочно-кишечного тракта
AUC [H + ] или просто AUC («интегральная кислотность») — широко используемое в зарубежных работах обозначение показателя, применяемого для оценки кислотоподавляющих свойств лекарственных препаратов и равного площади под заданным участком рН-метрической кривой. В отечественной литературе этот показатель называется «площадь ощелачивания» (Рапопорт С.И. и др.). AUC [H + ] равен S (iн, iк, 0) работы «Математический анализ компьютерных рН-грамм верхних отделов ЖКТ (п. 4 на стр. 2)».
Статьи
| Предупреждение! Препарат рецептурного отпуска! Использовать только после назначения врача! |
Оглавление
Лорноксикам полностью всасывается после внутримышечной инъекции и после перорального применения (Dittrich 1993; Skjodt and Davies 1998) (Рисунок 1).
Исследование абсорбции одноразовой дозы радиоактивно-меченного [14C] водного раствора лорноксикама обнаружило быстрое всасывание препарата в желудочно-кишечном тракте с временем достижения максимальной концентрации в плазме (Tmax), составляющего 0,5 часа (Nahler 1993).
В последующих исследованиях было показано, что после приема 4 мг дозы лорноксикама его максимальная концентрация в плазме (Cmax), составляющая 280 пг/л, достигалась в течение 2,5 час. (Hitzenberger, Radhofer-Welte et al. 1990). В исследованиях на молодых здоровых добровольцах было показано, что при использовании доз лорноксикама от 2 до 6 мг, принимаемых два раза в сутки на протяжении 2 недель площадь под кривой зависимости концентрации препарата в сыворотке от времени (AUC) является пропорциональной введенной дозе (Ankier, Brimelow et al. 1988). В других исследованиях величины Cmax и AUC лорноксикама указывали на слабую аккумуляцию лорноксикама у пациентов старшего возраста при повторном пероральном приеме 8 мг лорноксикама на протяжении 1 недели (Strobel 1995). Прием пищи замедлял и уменьшал абсорбцию лорноксикама, о чем свидетельствовало приблизительно 15-и% уменьшение величин AUC и увеличение Tmax от 1,5 до 2,3 часов (Mayerhofer, Welte et al. 1989).
Биологическая доступность лорноксикама как после его внутримышечного, так и после перорального применения в виде стандартных таблеток практически составляла 100%, ректальное введение тех же доз лорноксикама обеспечивало лишь 65% биологическую доступность препарата (Dittrich 1993).
Таблица 1. Фармакокинетика лорноксикама после приема одноразовых доз (Dittrich 1993)
| Доза 8 мг | в/в | в/м | доп | Табл-ки | Табл. 16 мг |
|---|---|---|---|---|---|
| Cmax | 1894 a | 1133 | 405 | 822 | 1620 |
| Tmax | 0,39 | 1,72 | 1,63 | 1,53 | |
| AUC | 4118 | 4063 | 2506 | 3596 | 8103 |
| f | 100% | 65% | 89% | 100% b | |
| T1/2 | 3,92 | 3,69 | 3,93 | 3,81 | 4,09 |
| VD | 11,95 | 11,28 | 11,92 | 11,45 | 12,37 |
a Экстраполированная величина.
b Коррегированная для дозы величина.
Рисунок 1. AUC и Cmax на мг дозы (Dittrich 1993) 
Таблица 2. Фармакокинетика лорноксикама (данные получены на молодых здоровых добровольцах после перорального применения одноразовых доз)
| Доза (мг) | Ссылки на источники | К-во испытуемых | Медиана Tmax (час) | Средняя Cmax [μг/л (SD)] | Выведение T1/2 [час (SD)] | Средняя AUC 0–∞ [μг/л·час (SD)] |
| 2 | (Ankier and others 1988) | 6 | 2.5 | 133 (56) | 2.4 (1.3) | 546 (342) |
| 4 a | (Ankier and others 1988; Dittrich, Radhofer-Welte et al. 1990) | 63 | 2.0–3.0 | 299 (63) – 363 (110) a | 2.6 (1.3) – 5.2 (3.5) a | 1531 (567) – 1744 (348) a |
| 6 | (Ankier and others 1988) | 6 | 6.0 | 309 (92) | 3.7 (2.2) | 1595 (592) |
| 8 b | (Dittrich, Radhofer-Welte et al. 1990; Dittrich 1993; Radhofer-Welte, Dittrich et al. 2005) | 30 | – | 678 (151) – 822 (199) b | 2.8 (0.8) – 3.8 (1.0) b | 2707 (680) – 3596 (1538) b |
| 8 c | (Radhofer-Welte and others 2005) | 18 | 0.5 | 1101 (318) c | 3.4 (15) c | 3740 (2038) c |
| 16 | (Geisler 1993) | 18 | – | 1620 (439) | 4.1 (1.1) | 8103 (3842) |
a Средние величины по данным пяти исследований.
b Средние величины по данным двух исследований.
c Величины исследования с применением быстровыводимого лорноксикама.
Форма Xefocam® Rapid (Форма ускоренного воздействия)
Разработаны новые быстро абсорбируюемые формы препарата Xefocam® в таблетках. Эта техника освобождает 90% активного лекарства уже после 5 минут.
Эта форма препарата – Xefocam®Rapid (форма ускоренного воздействия) имеет такую же биологическую доступность как стандартные перорально применяемые таблетки и в/м вводимые препараты, но абсорбция этой формы протекает более быстро, чем в случае приема стандартных таблеток Xefocam®.
Рисунок 4. Плазматические уровни лорноксикама после приема 8 мг Xefocam® Rapid, стандартных таблеток и введения инъекции (в/м) (Radhofer-Welte and others 2005).
Абсцисса: период времени после приема дозы в часах
Ордината: нг/мл
Легенда: Xefocam® стандартные таблетки, Xefocam® Rapid, Xefocam® инъекции (в/м)
Фармакокинетика Xefocam®Rapid оценивалась в фармакокинетическом исследовании в сравнении с Xefocam® стандартные таблетки и Xefocam® инъекции (в/м) у 18 добровольцев (Radhofer-Welte and others 2005).
На рисунке 4 иллюстрируются кривые плазменной концентрации, полученные в этом исследовании. Период полувыведения препарата из плазмы был идентичным для всех трех форм (3,0-3,4 час.), но как можно видеть на Рисунке 5 Xefocam®Rapid (ускоренного действия) и Xefocam® инъекции (в/м) абсорбировались более быстро (Tmax 0,5 и 0,3 час. соответственно), в то время как Xefocam® стандартные таблетки абсорбировались медленнее (1,5 час.) (Radhofer-Welte and others 2005).
Рисунок 2. Tmax для различных форм препарата (Radhofer-Welte and others 2005)
Абсцисса: Xefocam® Rapid, Xefocam® стандартные таблетки, Xefocam® инъекции (в/м)
С другой стороны, как можно видеть на Рисунке 6, биологическая доступность препарата, оцениваемая на основании AUC была почти идентичной у всех трех форм (Radhofer-Welte and others 2005).
Рисунок 6. AUC (площадь под кривой концентрация препарата в плазме – время) для трех разных форм препарата (Radhofer-Welte and others 2005)
Абсцисса: Xefocam® Rapid, Xefocam® стандартные таблетки, Xefocam® инъекции (в/м) 
Метрики в задачах машинного обучения
В задачах машинного обучения для оценки качества моделей и сравнения различных алгоритмов используются метрики, а их выбор и анализ — непременная часть работы датасатаниста.
В этой статье мы рассмотрим некоторые критерии качества в задачах классификации, обсудим, что является важным при выборе метрики и что может пойти не так.
Метрики в задачах классификации
Для демонстрации полезных функций sklearn и наглядного представления метрик мы будем использовать датасет по оттоку клиентов телеком-оператора.
Accuracy, precision и recall
Перед переходом к самим метрикам необходимо ввести важную концепцию для описания этих метрик в терминах ошибок классификации — confusion matrix (матрица ошибок).
Допустим, что у нас есть два класса и алгоритм, предсказывающий принадлежность каждого объекта одному из классов, тогда матрица ошибок классификации будет выглядеть следующим образом:
| True Positive (TP) | False Positive (FP) | |
| False Negative (FN) | True Negative (TN) |
Здесь — это ответ алгоритма на объекте, а
— истинная метка класса на этом объекте.
Таким образом, ошибки классификации бывают двух видов: False Negative (FN) и False Positive (FP).
Accuracy
Интуитивно понятной, очевидной и почти неиспользуемой метрикой является accuracy — доля правильных ответов алгоритма:
Эта метрика бесполезна в задачах с неравными классами, и это легко показать на примере.
Допустим, мы хотим оценить работу спам-фильтра почты. У нас есть 100 не-спам писем, 90 из которых наш классификатор определил верно (True Negative = 90, False Positive = 10), и 10 спам-писем, 5 из которых классификатор также определил верно (True Positive = 5, False Negative = 5).
Тогда accuracy:
Однако если мы просто будем предсказывать все письма как не-спам, то получим более высокую accuracy:
При этом, наша модель совершенно не обладает никакой предсказательной силой, так как изначально мы хотели определять письма со спамом. Преодолеть это нам поможет переход с общей для всех классов метрики к отдельным показателям качества классов.
Precision, recall и F-мера
Для оценки качества работы алгоритма на каждом из классов по отдельности введем метрики precision (точность) и recall (полнота).
Precision можно интерпретировать как долю объектов, названных классификатором положительными и при этом действительно являющимися положительными, а recall показывает, какую долю объектов положительного класса из всех объектов положительного класса нашел алгоритм.
Именно введение precision не позволяет нам записывать все объекты в один класс, так как в этом случае мы получаем рост уровня False Positive. Recall демонстрирует способность алгоритма обнаруживать данный класс вообще, а precision — способность отличать этот класс от других классов.
Как мы отмечали ранее, ошибки классификации бывают двух видов: False Positive и False Negative. В статистике первый вид ошибок называют ошибкой I-го рода, а второй — ошибкой II-го рода. В нашей задаче по определению оттока абонентов, ошибкой первого рода будет принятие лояльного абонента за уходящего, так как наша нулевая гипотеза состоит в том, что никто из абонентов не уходит, а мы эту гипотезу отвергаем. Соответственно, ошибкой второго рода будет являться “пропуск” уходящего абонента и ошибочное принятие нулевой гипотезы.
Precision и recall не зависят, в отличие от accuracy, от соотношения классов и потому применимы в условиях несбалансированных выборок.
Часто в реальной практике стоит задача найти оптимальный (для заказчика) баланс между этими двумя метриками. Классическим примером является задача определения оттока клиентов.
Очевидно, что мы не можем находить всех уходящих в отток клиентов и только их. Но, определив стратегию и ресурс для удержания клиентов, мы можем подобрать нужные пороги по precision и recall. Например, можно сосредоточиться на удержании только высокодоходных клиентов или тех, кто уйдет с большей вероятностью, так как мы ограничены в ресурсах колл-центра.
Обычно при оптимизации гиперпараметров алгоритма (например, в случае перебора по сетке GridSearchCV ) используется одна метрика, улучшение которой мы и ожидаем увидеть на тестовой выборке.
Существует несколько различных способов объединить precision и recall в агрегированный критерий качества. F-мера (в общем случае ) — среднее гармоническое precision и recall :
в данном случае определяет вес точности в метрике, и при
это среднее гармоническое (с множителем 2, чтобы в случае precision = 1 и recall = 1 иметь
)
F-мера достигает максимума при полноте и точности, равными единице, и близка к нулю, если один из аргументов близок к нулю.
В sklearn есть удобная функция _metrics.classificationreport, возвращающая recall, precision и F-меру для каждого из классов, а также количество экземпляров каждого класса.
| class | precision | recall | f1-score | support |
|---|---|---|---|---|
| Non-churned | 0.88 | 0.97 | 0.93 | 941 |
| Churned | 0.60 | 0.25 | 0.35 | 159 |
| avg / total | 0.84 | 0.87 | 0.84 | 1100 |
Здесь необходимо отметить, что в случае задач с несбалансированными классами, которые превалируют в реальной практике, часто приходится прибегать к техникам искусственной модификации датасета для выравнивания соотношения классов. Их существует много, и мы не будем их касаться, здесь можно посмотреть некоторые методы и выбрать подходящий для вашей задачи.
AUC-ROC и AUC-PR
При конвертации вещественного ответа алгоритма (как правило, вероятности принадлежности к классу, отдельно см. SVM) в бинарную метку, мы должны выбрать какой-либо порог, при котором 0 становится 1. Естественным и близким кажется порог, равный 0.5, но он не всегда оказывается оптимальным, например, при вышеупомянутом отсутствии баланса классов.
Одним из способов оценить модель в целом, не привязываясь к конкретному порогу, является AUC-ROC (или ROC AUC) — площадь (Area Under Curve) под кривой ошибок (Receiver Operating Characteristic curve ). Данная кривая представляет из себя линию от (0,0) до (1,1) в координатах True Positive Rate (TPR) и False Positive Rate (FPR):
TPR нам уже известна, это полнота, а FPR показывает, какую долю из объектов negative класса алгоритм предсказал неверно. В идеальном случае, когда классификатор не делает ошибок (FPR = 0, TPR = 1) мы получим площадь под кривой, равную единице; в противном случае, когда классификатор случайно выдает вероятности классов, AUC-ROC будет стремиться к 0.5, так как классификатор будет выдавать одинаковое количество TP и FP.
Каждая точка на графике соответствует выбору некоторого порога. Площадь под кривой в данном случае показывает качество алгоритма (больше — лучше), кроме этого, важной является крутизна самой кривой — мы хотим максимизировать TPR, минимизируя FPR, а значит, наша кривая в идеале должна стремиться к точке (0,1).
Критерий AUC-ROC устойчив к несбалансированным классам (спойлер: увы, не всё так однозначно) и может быть интерпретирован как вероятность того, что случайно выбранный positive объект будет проранжирован классификатором выше (будет иметь более высокую вероятность быть positive), чем случайно выбранный negative объект.
Рассмотрим следующую задачу: нам необходимо выбрать 100 релевантных документов из 1 миллиона документов. Мы намашинлернили два алгоритма:
Скорее всего, мы бы выбрали первый алгоритм, который выдает очень мало False Positive на фоне своего конкурента. Но разница в False Positive Rate между этими двумя алгоритмами крайне мала — всего 0.0019. Это является следствием того, что AUC-ROC измеряет долю False Positive относительно True Negative и в задачах, где нам не так важен второй (больший) класс, может давать не совсем адекватную картину при сравнении алгоритмов.
Для того чтобы поправить положение, вернемся к полноте и точности :
Здесь уже заметна существенная разница между двумя алгоритмами — 0.855 в точности!
Precision и recall также используют для построения кривой и, аналогично AUC-ROC, находят площадь под ней.
Здесь можно отметить, что на маленьких датасетах площадь под PR-кривой может быть чересчур оптимистична, потому как вычисляется по методу трапеций, но обычно в таких задачах данных достаточно. За подробностями о взаимоотношениях AUC-ROC и AUC-PR можно обратиться сюда.
Logistic Loss
Особняком стоит логистическая функция потерь, определяемая как:
здесь — это ответ алгоритма на
-ом объекте,
— истинная метка класса на
-ом объекте, а
размер выборки.
Подробно про математическую интерпретацию логистической функции потерь уже написано в рамках поста про линейные модели.
Данная метрика нечасто выступает в бизнес-требованиях, но часто — в задачах на kaggle.
Интуитивно можно представить минимизацию logloss как задачу максимизации accuracy путем штрафа за неверные предсказания. Однако необходимо отметить, что logloss крайне сильно штрафует за уверенность классификатора в неверном ответе.
Отметим, как драматически выросла logloss при неверном ответе и уверенной классификации!
Следовательно, ошибка на одном объекте может дать существенное ухудшение общей ошибки на выборке. Такие объекты часто бывают выбросами, которые нужно не забывать фильтровать или рассматривать отдельно.
Всё становится на свои места, если нарисовать график logloss:
Видно, что чем ближе к нулю ответ алгоритма при ground truth = 1, тем выше значение ошибки и круче растёт кривая.
Подытожим:
Полезные ссылки
Благодарности
Спасибо mephistopheies и madrugado за помощь в подготовке статьи.
Значительно увеличить auc что это
(А) Лекарственные средства попадают в организм и выводятся из него разными путями. Таким образом, организм представляет собой открытую систему, в которой фактическая концентрация препарата отражает взаимодействие между его поступлением (приемом) и эвакуацией (элиминацией).
Скорость всасывания препарата в желудке и кишечнике зависит от множества факторов: скорости растворения вещества (в случае приема твердой лекарственной формы) и транзита по ЖКТ, проницаемости слизистой для препарата, его градиента концентрации на границе слизистой и крови,кровоснабжения слизистой оболочки.
Всасывание из кишечника приводит к повышению концентрации лекарственного вещества в крови. Препарат разносится с кровью к различным органам (распределение), которые поглощают его в количестве, соответствующем его химическим свойствам и скорости кровотока через орган.
Например, органы с хорошим кровоснабжением, такие как головной мозг, получают большее количество препарата, чем органы с низким кровоснабжением. В результате поглощения тканями происходит снижение концентрации лекарственного вещества в крови. По мере снижения градиента на границе слизистой оболочки и крови всасывание в кишечнике замедляется. Пик концентрации в крови достигается тогда, когда количество вещества, покидающего кровь за единицу времени, равно количеству всосавшегося.
Поступление вещества в ткани печени и почек представляет собой перемещение в органы выведения. Концентрация препарата в крови в различные периоды времени представляет собой совокупность процессов абсорбции, распределения и элиминации, которые пересекаются во времени.
Если распределение происходит значительно быстрее, чем элиминация, снижение концентрации в крови вначале происходит быстро, а затем замедляется. Фаза быстрого снижения обозначается как α-фаза (фаза распределения), медленного — как β-фаза (фаза элиминации). Если препарат распределяется быстрее, чем абсорбируется, концентрацию препарата в крови можно описать математически упрощенной функцией Бейтмена (k1 и k2 — константы скорости для абсорбции и элиминации соответственно).
(В) Скорость абсорбции зависит от способа введения препарата. Чем выше скорость абсорбции, тем короче будет время (tmax), которое требуется для достижения пика концентрации в плазме (cmax), тем выше будет cmax и тем раньше уровень препарата в крови снова начнет снижаться.
Площадь под кривой, описывающей зависимость концентрации препарата в крови от времени (AUC), не зависит от пути введения препарата при условии, что доза и биодоступность остаются теми же (закон соответственных состояний). Таким образом, AUC можно использовать для вычисления биодоступности (F) препарата.
Значение AUC, измеренное после приема внутрь и в/в введения определенной дозы конкретного лекарственного вещества, соответствует проценту вещества, попавшего в системный кровоток после приема внутрь: F = AUCприем внутрь/AUCв/в введение.
Определение концентрации препарата в крови позволяет сравнить различные патентованные лекарственные средства, содержащие одно и то же действующее вещество в одинаковой дозе. Идентичные кривые зависимости концентрации в крови от времени для препаратов различных производителей (при условии стандартных лекарственных форм) означают биоэквивалентность стандартного вещества и нового исследуемого препарата.
Редактор: Искандер Милевски. Дата обновления публикации: 18.3.2021






